新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術t? l?(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
業內人士認為,t? l?除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 3962踩: 37
t? l?
人參與 | 時間:2025-09-18 21:54:58
評論專區
相關文章
- 韓版小眾設計師簡約復古大容量帆布森系文藝單肩包2022百搭手提包
- 戴爾科技集團:2026 財年第二財季營收298億美元,同比增長19%
- 知乎啟動2025科學季 韓濟生、龐國芳、勵建安三位院士領銜創作
- 魅族22售價2999元起,Flyme Auto用戶數量突破150萬
- “賽博樂隊”現場才藝表演!人形機器人表演電吉他、架子鼓
- 螞蟻集團副總裁周蕓:AI落地難的根源遠不止技術準確率
- 嵐圖汽車CEO盧放:全新嵐圖知音充電速度是某Y的兩倍
- 如祺出行發布中期業績:總收入增長61.7%,毛利率首次轉正
- Rokid今日開啟海外眾籌,或破AI眼鏡最高籌款記錄
- 光峰科技:仲裁事項落定輕裝上陣,光博會將攜前沿技術亮相