新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術kubet77.(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
kubet77.業內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 15踩: 164
kubet77.
人參與 | 時間:2025-09-17 01:56:59
評論專區
相關文章
- 短途行李包女手提旅行袋輕便大容量裝衣服出差旅游包男運動健身包
- 釘釘無招:剛回歸時感覺團隊對AI認知有限,且有較強的傲慢感
- 特斯拉與火山引擎達成合作,全新Model Y L車型接入豆包大模型
- 快手2025Q2財報:總營收350億元 經調整凈利潤達56億元
- 上新ins可愛斜挎小布包包女2022潮時尚洋氣學生百搭少女單肩胸包
- 開源版Genie 3世界模型來了:實時+長時間交互,單卡可跑,國內公司出品
- 瑞銀:英偉達季報發布后 大型科技股仍具吸引力
- 嗶哩嗶哩第二季度營收73億元 經調凈利潤5.6億元
- 阿里發布Agentic Coding平臺Qoder,可實現AI自主研發
- 字節跳動回應“AI眼鏡”報道:網傳信息不準確