Artificial Analysis Video Arena의 수천 건의 사람 평가 블라인드 비교를 바탕으로, Happy Horse 1.0은 텍스트 투 비디오와 이미지 투 비디오 모두에서 화질, 물리적 사실감, 프롬프트 정합성 측면에서 세계 최고 수준의 순위를 유지하고 있습니다.
Happy Horse 1.0은 2026년 초 공개되었으며, 핵심은 40층 self-attention Transformer 아키텍처입니다.
이 릴리스는 완전한 오픈소스 및 상업적 사용 가능 라이선스로 제공되며, 기본 모델, 8단계 증류 모델, 독자적인 초해상도 모듈, 최적화된 추론 코드를 포함해 온프레미스 인프라에 바로 배포할 수 있습니다.
40층 self-attention 네트워크가 단일 스트림 처리와 헤드별 게이팅을 결합해 대규모 학습에서도 높은 안정성을 제공합니다.
대사, 환경음, 폴리 사운드를 비디오 프레임과 함께 네이티브로 생성하여 추가 후반 작업이 필요 없습니다.
CFG 없이도 노이즈 제거 단계를 대폭 줄이고 MagiCompiler 런타임으로 최대 10배 빠른 생성을 지원합니다.
7개 언어(EN, ZH, JP, KO, DE, FR)를 네이티브 지원하며 공개 평가에서 업계 최고 수준의 단어 오류율을 기록합니다.
5~8초 길이의 고품질 클립을 1080p까지 네이티브 업스케일하고 16:9, 9:16 등 주요 비율을 지원합니다.
기업 내부 실행을 염두에 둔 관대한 오픈소스 모델로, 투명한 코드가 프라이버시 보장을 돕습니다.
Happy Horse 1.0 코드베이스와 모델 가중치는 현재 최종 공개 준비 단계에 있습니다.
FP8 양자화 타깃, 증류 체크포인트, 공개 문서는 첫 번째 오픈 릴리스를 위해 최종 정리 중입니다.