Seedance 1.0
Seedance 1.0 是一個支持文本和圖像輸入的多鏡頭影片生成模型。它在語義理解和提示跟隨方面有了改進,能夠創建具有流暢運動、豐富細節和電影美學的1080p影片。
Seedance 1.0 主要技術特點
流暢穩定的運動
Seedance 1.0 擁有廣泛的動態範圍,能夠流暢地生成大規模運動。從微妙的表情到活躍的場景,它保持高度的穩定性和物理現實感。
原生多鏡頭敘事
原生支持生成具有多個連貫鏡頭的敘事影片。在鏡頭轉換和時空轉換中,它保持主題、視覺風格和氛圍的一致性。
多樣化的風格表達
從照片寫實主義和賽博朋克到插畫和毛氈質感,Seedance 1.0 能夠準確地解釋多樣的風格提示,以支持廣泛的創意需求。
精確的提示跟隨
準確解析自然語言提示,實現對多代理交互、複雜動作序列和豐富多樣的鏡頭運動的穩定控制,將文本概念轉化為影片。
Seedance 1.0 技術架構與改進
根據字節跳動 Seed 團隊發佈的技術報告,Seedance 1.0 是一個高性能且推理高效的影片基礎生成模型,集成了多項技術改進:
多源數據策展
多源數據策展結合精確且有意義的影片標註,支持在多樣場景中的全面學習
預訓練範式優化
支持交錯的多模態位置編碼、原生多鏡頭生成能力和多任務建模能力
後訓練優化
利用細粒度監督微調和影片特定的RLHF,通過多維獎勵機制提升性能
模型加速技術
通過多階段蒸餾策略和系統級優化實現10倍推理加速
性能結果
Seedance 1.0 測試結果
與其他行業模型相比,Seedance 1.0 在提示依從性、運動質量和美學等核心維度上表現良好
- 在T2V任務中,於提示依從性、運動質量和美學方面獲得高分
- 在I2V任務中也獲得高分,並有效保持與源圖像的一致性
- 根據Artificial Analysis網站數據,截至2025年6月9日,Seedance 1.0 在相關評估中表現良好
常見問題
Seedance 1.0 是一個支持文本和圖像輸入的多鏡頭影片生成模型。主要特點包括:語義理解和提示跟隨的改進,能在41.4秒內生成5秒長的1080p影片,原生多鏡頭敘事能力,及通過技術優化實現10倍推理加速。
Seedance 1.0 支持文本和圖像輸入方法,能生成1080p分辨率的影片。該模型能創建具有流暢運動、豐富細節和電影美學的影片內容。
多鏡頭敘事是Seedance 1.0 的一個原生功能,支持生成具有多個連貫鏡頭的敘事影片。在鏡頭轉換和時空轉換中,該模型保持主題、視覺風格和氛圍的一致性。
Seedance 1.0 支持多樣化的風格表達,從照片寫實主義和賽博朋克到插畫和毛氈質感,準確解釋各種風格提示以滿足不同的創意需求。