豆包發布語音識別模型2.0 支持多模態視覺識別和13種海外語種

新聞分享

如欲分享新聞，請填寫收件人及閣下之電郵，再按「送出」。*必需填寫

收件者電郵*

請用分號「;」分隔不同電郵地址，例子：a@a.com;b@b.com

閣下之電郵*

分享內容

豆包發布語音識別模型2.0 支持多模態視覺識別和13種海外語種

今日，火山引擎正式發佈豆包語音識別模型2.0（Doubao-Seed-ASR-2.0），依托Seed混合專家大語言模型架構建構。據官方介紹，2.0版模型推理能力提升，可透過深度理解上下文完成精準識...

重設

送出

視窗將於5秒內關閉

豆包發布語音識別模型2.0 支持多模態視覺識別和13種海外語種

關閉

滙港資訊

推薦

利好

利淡

沽空

股價

AASTOCKS旗下aacat開證券戶口送1股Intel/指定黃金ETF!

<匯港通訊> 今日，火山引擎正式發佈豆包語音識別模型2.0（Doubao-Seed-ASR-2.0），依托Seed混合專家大語言模型架構建構。

據官方介紹，2.0版模型推理能力提升，可透過深度理解上下文完成精準識別，上下文整體關鍵字召回率提升20%。支持多模態視覺識別，在聽得懂的同時看得懂，可以透過單圖和多圖等視覺訊息輸入來提升文字辨識精準度。

同時支援日語、韓語、德語、法語等13種海外語種的識別。並且重點在於針對專有名詞、人名、地名、品牌名稱及易混淆多音字等複雜場景進行了升級。

#豆包 #人工智能 (CW)

新聞來源 (不包括新聞圖片): 滙港資訊

免責聲明 : 以上資訊僅供參考。AASTOCKS.com Limited對以上資訊的內容不承擔任何責任，對其準確性，完整性，品質，及時性，或可靠性不作任何陳述或予以認可，並明確表示不對任何由本資訊的全部或部分內容引致之損失或損害承擔任何法律責任或為其引起的損失負責。以上資訊或反映了相關文章或專題作者的的個人意見和觀點，並不代表AASTOCKS.com Limited的立場。以上資訊的任何內容均不構成AASTOCKS為任何投資作出招攬、提出要約、意見或推薦，或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務。投資者必須按其本身投資目標及財務狀況自行作出投資決定。

免責聲明