新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術bd lu 5(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
業內人士認為,bd lu 5除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 99踩: 256
bd lu 5
人參與 | 時間:2025-09-25 14:55:33
評論專區
相關文章
- 京東全球科技探索者大會定檔9月25日
- 餃子包女腰包小號高級感單肩包百搭男生斜挎包2022新款時尚小包包
- 香港代購真皮女包包2022新款潮大氣女士印花托特包手提單肩子母包
- 機器人奏響外灘大會主題曲,靈心巧手聯創“驕傲”喊話:我們做出來了,老外沒有
- 星紀魅族萬志強:22是魅族史上打磨時間最久的一臺手機,數字系列不再區分Pro版與標準版
- 螞蟻集團與浙商銀行達成深化戰略合作,將共創數智金融生態
- 百度CTO王海峰:飛漿文心生態開發者數量超2333萬,企業超76萬家
- 滴滴:為掃清干擾專注公司發展同意和解集體訴訟
- 閻雙創造2022新款雙肩包大容量斜挎包民族風旅行包青年女士背包潮
- 菜鳥CEO萬霖:全球電商雖然短期有不確定性,但長期看好電商發展