Seedance 1.0

Seedance 1.0 は、テキストと画像の両方の入力をサポートするマルチショットビデオ生成モデルです。セマンティック理解とプロンプトフォローの改善を特徴としており、スムーズな動き、豊かなディテール、シネマティックな美学を備えた1080pビデオを作成できます。

Seedance 1.0 主な技術的特徴

スムーズで安定した動き

Seedance 1.0 は広いダイナミックレンジを備えており、大規模な動きをスムーズに生成できます。微妙な表情から活発なシーンまで、高い安定性と物理的リアリズムを維持します。

ネイティブマルチショットストーリーテリング

複数の一貫したショットを持つナラティブビデオの生成をネイティブにサポートします。ショットの切り替えや時空間シフトにおいて、メインテーマ、ビジュアルスタイル、雰囲気の一貫性を維持します。

多様なスタイリスティック表現

フォトリアリズムやサイバーパンクからイラストやフェルトテクスチャまで、Seedance 1.0 は多様なスタイリスティックプロンプトを正確に解釈し、幅広いクリエイティブニーズをサポートします。

正確なプロンプトフォロー

自然言語プロンプトを正確に解析し、マルチエージェントの相互作用、複雑なアクションシーケンス、豊かなカメラ動きを安定的に制御し、テキストコンセプトをビデオに変換します。

Seedance 1.0 技術アーキテクチャと改善

ByteDance Seed チームによって公開された技術報告によると、Seedance 1.0 は高性能で推論効率の高いビデオ基盤生成モデルであり、複数の技術的改善を統合しています:

マルチソースデータキュレーション

正確で意味のあるビデオキャプションを組み合わせたマルチソースデータキュレーションにより、多様なシナリオにわたる包括的な学習をサポート

事前学習パラダイムの最適化

交互のマルチモーダル位置エンコーディング、ネイティブなマルチショット生成能力、マルチタスクモデリング能力をサポート

事後学習最適化

細かい監督付き微調整とビデオ固有のRLHFを使用し、マルチディメンショナルな報酬メカニズムでパフォーマンスを向上

モデル加速技術

マルチステージ蒸留戦略とシステムレベルの最適化により、10倍の推論速度を達成

パフォーマンス結果

Seedance 1.0 テスト結果

他の業界モデルと比較して、Seedance 1.0 はプロンプトの順守、動作品質、美学などの主要な側面で優れています

  • プロンプトの順守、動作品質、美学においてT2Vタスクで高得点を達成
  • I2Vタスクでも高得点を達成し、ソース画像との一貫性を効果的に維持
  • Artificial Analysis ウェブサイトのデータによると、2025年6月9日現在、Seedance 1.0 は関連評価で優れたパフォーマンスを発揮

よくある質問

Seedance 1.0 は、テキストと画像の両方の入力をサポートするマルチショットビデオ生成モデルです。主な特徴には、セマンティック理解とプロンプトフォローの改善、41.4秒で5秒間の1080pビデオを生成する能力、ネイティブなマルチショットストーリーテリング能力、技術的最適化による10倍の推論速度が含まれます。

Seedance 1.0 はテキストと画像の入力方法をサポートし、1080p解像度のビデオを生成できます。モデルはスムーズな動き、豊かなディテール、シネマティックな美学を備えたビデオコンテンツを作成できます。

マルチショットストーリーテリングは、Seedance 1.0 のネイティブ機能であり、複数の一貫したショットを持つナラティブビデオの生成をサポートします。ショットの切り替えや時空間シフトにおいて、モデルはメインテーマ、ビジュアルスタイル、雰囲気の一貫性を維持します。

Seedance 1.0 は、フォトリアリズムやサイバーパンクからイラストやフェルトテクスチャまで、多様なスタイリスティック表現をサポートし、異なるクリエイティブニーズに応じてさまざまなスタイリスティックプロンプトを正確に解釈します。