新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業(yè)內首次實現(xiàn)多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務。
據(jù)介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術kèo ch?p(Latent Multi-ModalPlanner), 能夠自主協(xié)調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現(xiàn)中文語音細節(jié)與情感表達。在效果上能夠實現(xiàn)電影級高清視頻畫面、逼真環(huán)境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業(yè)70%。
業(yè)內人士認為,kèo ch?p除了質量提升,百度蒸汽機2.0也帶來了創(chuàng)作成本大幅下降。知名視效指導姚騏在此次發(fā)布會現(xiàn)場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 4踩: 998
kèo ch?p
人參與 | 時間:2025-09-23 08:02:58
評論專區(qū)
相關文章
- 宇樹科技預告新機器人:身高180,31個關節(jié)自由度,動作靈活且優(yōu)雅
- 商湯集團:2025上半年營收24億元,同比增長36%
- 快手雙11激勵政策:將投入20億用戶紅包及10億商品補貼
- 瑞銀:英偉達季報發(fā)布后 大型科技股仍具吸引力
- 初瑞雪接棒辛選首播:場觀2小時內破2400萬人
- 得物App:與蘋果官網同步首發(fā)iPhone 17全系列新品
- 螞蟻集團副總裁周蕓:AI落地難的根源遠不止技術準確率
- 小米澎湃OS 3發(fā)布:全面接入蘋果生態(tài),小米手機和蘋果生態(tài)設備可實現(xiàn)跨端協(xié)同
- 太勵志!機器人失去一條手臂仍堅持比賽
- 菜鳥進一步強化全球物流網絡:與卡塔爾航空貨運達成長期戰(zhàn)略合作