Happy Horse 1.0 を基盤とする Happy Horse Generator は、テキストから動画、画像から動画、同期音声、物理的リアリズム、多言語リップシンクを 1 つに統合したオープンソース AI 動画生成モデルです。
Artificial Analysis Video Arena における数千件の人手によるブラインド比較に基づき、Happy Horse 1.0 はテキストから動画・画像から動画の両分野で、画質、物理的リアリズム、プロンプト整合性において継続的に世界上位を記録しています。
Happy Horse 1.0 は 2026 年初頭に公開され、40 層の自己注意 Transformer アーキテクチャを中核に構築されています。
本リリースは完全なオープンソースかつ商用利用可能なライセンスで提供され、ベースモデル、8 ステップ蒸留モデル、独自超解像モジュール、最適化済み推論コードを含み、オンプレミス環境にそのまま導入できます。
40 層の自己注意ネットワークにより、単一ストリーム処理とヘッド単位のゲーティングを実現し、大規模学習でも高い安定性を確保します。
台詞、環境音、フォーリーを映像フレームと同時にネイティブ生成し、追加の後処理を不要にします。
CFG なしで拡散ステップを大幅に削減し、MagiCompiler ランタイムにより最大 10 倍の高速化を実現します。
7 言語(EN、ZH、JP、KO、DE、FR)をネイティブサポートし、公開アリーナで優れた単語誤り率を記録しています。
5〜8 秒の高品質クリップを 1080p までネイティブにアップスケールし、16:9 と 9:16 の主要比率をカバーします。
社内運用を前提に設計された寛容なオープンソースモデルで、透明性の高いコードによりプライバシーを確保します。
Happy Horse 1.0 のコードベースとモデル重みは現在、最終公開準備段階にあります。
FP8 量子化ターゲット、蒸留チェックポイント、公開ドキュメントは、初回オープンリリースに向けて最終調整中です。