新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術keonhacai5(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
keonhacai5業內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 6踩: 9846
keonhacai5
人參與 | 時間:2025-09-29 19:58:51
評論專區
相關文章
- MARSHALL拓展回音壁產品線 推出全新Heston 60與Heston Sub 200
- 雀巢新能恩全護1段母愛級5種活性HMO益生菌適度水解低敏奶粉800g
- 泡泡瑪特發布2025半年報:營收138.8億元,5大IP收入破10億
- 超火小包包女夏天小眾設計絲巾手提包2022新款潮高級感法式水桶包
- vivo智慧終端產品總經理洪沂:vivo Vision是目前全球最輕的MR頭顯
- 歐美真皮印花拼色鎖扣鏈條包2022新款休閑百搭女包單肩斜挎小包包
- 螞蟻集團官宣:向假醫療廣告宣戰
- 唯品會發布2025年Q2財報:凈營收258億元,Non
- 夸克宣布覆蓋超七成大學生,AI滲透率超80%
- 阿里AI To C業務啟動近千人招聘,涉夸克、通義、AI眼鏡等業務