<匯港通訊> 騰訊混元發布並開源的語音數字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型及騰訊音樂天琴實驗室MuseV技術聯合研發,支持頭肩、半身與全身景別,以及多動態風格、多物種與雙人視頻場景,面向高視訊創作者的高視訊性場景。
使用者可上傳人物影像與音頻,HunyuanVideo-Avatar模型會自動理解圖片與音頻,例如人物所在環境、音頻所蘊含的情感等,讓圖中人物自然地說話或唱歌,生成包含自然表情、唇形同步及全身動作的視頻。
#騰訊 #人工智能 (CW)
新聞來源 (不包括新聞圖片): 滙港資訊