火山引擎正式发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),提升模型推理能力。新模型通过深度理解上下文完成精准识别,上下文整体关键词召回率提升20%;支持多模态视觉识别,不仅「听懂字」还能「看懂图」,通过单图和多图等视觉信息输入让文字识别更精准;并支持日语、韩语、德语及法语等13种海外语种的精准识别。(ta/u)相关内容内地半导体板块挫逾3% 中芯AH股挫6.7%及4%