<汇港通讯> 内地《科创板日报》报道,字节跳动火山引擎初步确定,周六(14日)发布豆包大模型的一系列重要升级,涉及豆包大模型2.0、音视频创作模型Seedance 2.0、图像创作模型Seedream 5.0 Preview。升级後的豆包大模型2.0,基础模型能力和企业级Agent能力将大幅提升。
报道指,豆包视频生成模型Seedance升级要点包括,复杂交互和运动生成可用率高,业界最佳级别;多模态能力全面,支持音、视、图全模态输入;可控性强,指令遵循表现好;深度适配影视、广告及行销场景,输出质量对齐工业交付标准。
至於豆包图像创作模型Seedream升级要点包括,首次引入实时检索增强能力,可以获取最新的知识和资讯,精准回应具有时效性的创作需求;世界知识与多语种能力增强,模型内置科技与人文领域丰富的世界知识;理解与生成表现全面提升,可以通过简短、模糊的文本和图像输入理解用户意图,主体一致性和图文对齐的表现也有进步。
此前,腾讯(00700)旗下腾讯混元0.3B端侧模型已上线;智谱(02513)已开源GLM-OCR,而其Pony Alpha新一代大模型据报亦已上线。阿里巴巴(09988)千问新一代基座模型Qwen3.5据报亦将於春节期间开源。 (ST)
新闻来源 (不包括新闻图片): 汇港资讯