이미지 생성 1위가 바뀌었다고?

2026.03.24 · 678 readers

안녕하세요, 캐럿팀입니다. 😊 이미지 아레나 1위가 바뀌었고, SNS에선 "바이럴 안 될 이미지"가 터졌어요. 오늘도 다양한 소식 같이 살펴봐요.

🔥 이미지 생성 1위가 바뀌었다고?

이미지 생성 AI 순위가 뒤집혔어요. 루마가 새로 공개한 이미지 모델 Uni-1이 인간 선호도 아레나에서 종합 1위를 차지했거든요.

기존에 1위를 지키던 나노바나나 2를 넘겼는데, 스타일 편집과 레퍼런스 기반 생성에서도 1위를 기록했어요. 텍스트 기반 이미지 생성에서는 2위고요.

이 모델이 특별한 건 구조 자체가 달라서예요. 기존 모델들이 이해와 생성을 따로 처리했다면, Uni-1은 프롬프트를 분석하고 이미지를 만드는 과정이 하나의 모델 안에서 동시에 일어나요. 나노바나나 프로도 추론 기반이긴 한데, 범용 LLM(제미나이) 위에 이미지 생성을 얹은 구조고요. Uni-1은 처음부터 이미지 전용으로 설계된 단일 모델이라는 차이가 있어요.

이미지 AI가 "예쁘게 그리기"를 넘어서 "이해하고 그리기" 단계로 접어들었어요. 캐럿에서도 루마 영상 모델을 제공하고 있으니, Uni-1도 곧 만나볼 수 있을 거예요.

📌 오늘의 소식 3가지

1️⃣ AI가 혼자 700번 실험하고 답을 찾았대요

테슬라 출신 AI 연구자 안드레이 카파시가 "자율 연구" 시스템을 공개했어요.

파이썬 코드 630줄로 만든 이 에이전트가 사람 개입 없이 2일 동안 700번의 실험을 자동으로 돌렸거든요. 20개의 최적화 방법을 스스로 찾아냈고, 이걸 적용하니 AI 학습 속도가 11% 빨라졌대요.

쇼피파이 CEO 토비아스 뤼트케도 직접 써봤는데, 하룻밤에 37번 실험해서 19% 성능 향상을 달성했어요. 카파시는 "측정할 수 있는 모든 지표는 에이전트가 자동으로 연구할 수 있다"고 했고요. 앞으로는 에이전트 수백 개가 동시에 실험하는 "연구 커뮤니티"를 만들 계획이라네요.

AI가 AI를 연구하는 시대가 열리고 있어요. 이게 이미지나 영상 모델에 적용되면, 모델 성능이 지금보다 훨씬 빠르게 좋아질 수 있다는 뜻이거든요.

2️⃣ AI 영상 4대장, 직접 비교해봤더니

미디엄 블로거 Kevin Gabeci가 클링 3.0, 소라 2, 씨댄스 2.0, 비오 3.1까지 네 모델을 실제 프로젝트에 투입해서 비교했어요. 각자 강한 영역이 확실히 달랐대요.

클링 3.0은 인물 동작에서 가장 강했어요. 쿵푸, 댄스, 러닝 같은 복잡한 움직임에서 팔다리가 꼬이거나 몸이 변형되는 문제가 거의 없었거든요. 빠른 프로토타이핑에 최적이라는 평가고요.

소라 2는 물리 시뮬레이션이 압도적이었대요. "유리잔이 바닥에 떨어지는" 프롬프트를 줬더니 파편 패턴, 액체 물리, 반사까지 정확하게 계산해냈다고 해요.

씨댄스 2.0은 입력 유연성에서 유일무이했어요. 이미지 9장, 영상 3개, 오디오 3개를 동시에 참조할 수 있는 건 이 모델뿐이거든요. 다만 글로벌 출시가 아직 미정이에요.

비오 3.1은 시네마틱 퀄리티에서 압승이었어요. 영화 표준인 24fps로 출력되고, 색보정이나 피사계 심도가 프로 수준이라 방송급 결과물이 바로 나온대요. 다만 최대 8초로 가장 짧고, 가격도 높은 편이에요.

인물 동작은 클링, 물리는 소라, 입력 유연성은 씨댄스, 시네마틱은 비오. 실무에서는 용도별로 나눠 쓰는 게 답이래요. 캐럿에서 클링, 소라 2, 비오 3.1 포함 11종을 한 곳에서 비교해볼 수 있어요.

3️⃣ 요즘 AI 커뮤니티에서 핫한 건 고양이라고?

AI 커뮤니티에서 요즘 상위권을 싹쓸이하고 있는 소재가 있어요. 고양이예요. 어제자 가장 반응이 좋았던 건 "마스터 고양이" 영상이에요. 인간과 고양이가 무술 대결을 벌이다가, 결국 고양이의 고전적 필살기인 "컵 떨어뜨리기"를 쓰면서 끝나거든요. 진지한 대결이 허무한 결말로 끝나는 반전이 웃음 포인트예요.

AI 영상 기술이 발전할수록, 사람들이 가장 먼저 만들어 보는 건 반려동물 콘텐츠인 거 같아요. 어려운 기술보다 "내 고양이로도 만들어볼까?"가 더 강한 동기가 되는 거죠. 캐럿에서 클링이나 소라 2로 직접 내 반려동물 영상을 만들어 볼 수 있어요.

🧪 오늘의 프롬프트 팁

"바이럴 안 될 이미지 만들어줘"

ChatGPT에 "절대 바이럴 안 될 이미지를 만들어줘"라고 요청한 사람이 있었어요. 결과가 어땠냐고요? 그 이미지가 1만 명 넘게 좋아요를 받으며 완전히 터졌어요. 역설이 후킹이 된 거예요. AI가 "바이럴 안 될 이미지"를 해석하는 방식 자체가 재밌거든요. 일부러 평범하게 만들려고 하는데, 그 시도가 오히려 묘하게 특이해져요.

프롬프트:

절대 바이럴이 되지 않을 이미지를 만들어줘.
인터넷에서 아무도 관심을 갖지 않을, 완벽하게 지루하고 평범한 이미지.

위 프롬프트를 캐럿에서 직접 만든 이미지예요 ↓

이 프롬프트의 핵심은 "부정 조건"이에요. AI한테 "하지 마"라고 하면 오히려 그 요소를 의식해서 어중간한 결과가 나오거든요. 그래서 결과물이 묘하게 웃긴 거예요. 캐럿에서 ChatGPT Image로 바로 해볼 수 있고, 결과물이 매번 달라서 여러 번 돌려보는 재미가 있어요.

오늘 프롬프트 팁, 한번 해보세요. AI가 "지루한 이미지"를 어떻게 해석하는지 보면 웃길 거예요 ☺️

Was this helpful? Share with your friends

Get daily AI trend updates