新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業(yè)內首次實現(xiàn)多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務。
據(jù)介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術thpt ly t? tr?ng tphcm(Latent Multi-ModalPlanner), 能夠自主協(xié)調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現(xiàn)中文語音細節(jié)與情感表達。在效果上能夠實現(xiàn)電影級高清視頻畫面、逼真環(huán)境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業(yè)70%。
業(yè)內人士認為,thpt ly t? tr?ng tphcm除了質量提升,百度蒸汽機2.0也帶來了創(chuàng)作成本大幅下降。知名視效指導姚騏在此次發(fā)布會現(xiàn)場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 18踩: 9717
thpt ly t? tr?ng tphcm
人參與 | 時間:2025-09-19 09:40:54
評論專區(qū)
相關文章
- 茅臺上線淘寶閃購,計劃全量上線全國6500家門店
- 全新深藍S07開啟預售,華為靳玉志:純視覺有一定短板,帶激光雷達的融合感知一定比純視覺好
- 歐米OMI女包2022新款時尚印花水桶包小眾設計鏈條腋下包PVC斜挎包
- 全新深藍S07開啟預售,華為靳玉志:純視覺有一定短板,帶激光雷達的融合感知一定比純視覺好
- 快手王劍偉:發(fā)力小游戲等內容變現(xiàn)賽道 預計未來一年分賬破億
- 山水集包包2022新款夏季高級軟皮時尚單肩斜挎包女通勤百搭小方包
- 駕駛證皮套男士高檔真皮超薄卡套純色個性證件套駕駛證卡包二合一
- 包包女新款時尚單肩包中年簡約媽媽尼龍小方包休閑牛津布斜挎女包
- 華為云張平安:整體業(yè)務持續(xù)健康增長,使用昇騰AI云服務客戶增長到1714家
- 以嶺藥業(yè)上半年盈利持續(xù)擴大 “研發(fā)型增長”重塑估值