千問(wèn)App接入最新萬(wàn)相Wan2.5,視頻能力全新升級(jí)
信息時(shí)報(bào)訊(記者 潘敬文)12月2日,千問(wèn)App接入萬(wàn)相系列最新模型Wan2.5,視頻創(chuàng)作能力再度升級(jí)。動(dòng)作精度和肢體協(xié)調(diào)性全面提升,并成為首個(gè)支持音視頻同時(shí)輸出的移動(dòng)端AI助手。
阿里萬(wàn)相2.5是目前業(yè)界少數(shù)具備音畫(huà)同步能力的視頻模型之一。該模型同時(shí)支持理解和生成等多種任務(wù),支持文本、圖像、視頻、音頻多種模態(tài)的輸入和輸出,在權(quán)威大模型評(píng)測(cè)LMArena上,萬(wàn)相的圖生視頻能力位居全球第三,穩(wěn)居國(guó)內(nèi)第一。
在千問(wèn)App上,用戶只需一張照片和一段文字,無(wú)須模板,即可生成一段肢體動(dòng)作自然、口型匹配準(zhǔn)確的1080P高清唱跳視頻,最長(zhǎng)支持10s。測(cè)試顯示,無(wú)論是真人照片、萌寵、二次元角色,還是文物、卡通形象,千問(wèn)App都可支持。
去年年初,阿里推出的照片跳舞功能迅速火爆國(guó)內(nèi)外,激發(fā)了網(wǎng)友的創(chuàng)作熱情,兵馬俑、萌娃、萌寵跳舞視頻在全網(wǎng)流傳。此次,千問(wèn)App接入萬(wàn)相2.5后,不僅全面提升視頻創(chuàng)作效果,還進(jìn)一步降低視頻創(chuàng)作門檻,支持用戶自定義上傳照片和輸入文字。例如,用戶僅需輸入一張圖片和一段“小貓一邊唱歌,一邊跳舞”的文字,千問(wèn)App便能精準(zhǔn)生成視頻,讓靜態(tài)形象瞬間“活”起來(lái)。
0人