新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術keonhacai5(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
keonhacai5業內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 3踩: 441
keonhacai5
人參與 | 時間:2025-09-20 22:53:52
評論專區
相關文章
- 菜鳥CEO萬霖:本財年以來,菜鳥海外快遞引入的外部訂單增長超200%
- IP產品占比近90%,名創優品華南首家MINISO LAND亮相廣州北京路
- 百度CTO王海峰:飛漿文心生態開發者數量超2333萬,企業超76萬家
- 聯想集團陳振寬:算力、模型和應用成為AI發展三條主線
- 途虎養車上半年收入同比增長10.5%至78.8億元,凈利潤4.1億元
- 李彥宏內部講話曝光:轉化率已超真人,百度數字人直播已達以假亂真地步
- 泄露公司機密被辭退,REDMI品牌總經理王騰發文道歉:接受該有的代價
- 阿里靈犀互娛匯報線從大文娛轉向集團?虎鯨文娛暫無回應
- 2022新款男士真皮手包男款純手工編織小牛皮商務休閑包面包手拿包
- 貓眼娛樂2025年中期業績:收入24.72億元 凈利潤1.79億元