-
友情链接:
Powered by 世博APP下载(官方)网站/网页版登录入口/手机版APP下载 @2013-2022 RSS地图 HTML地图
新浪科技讯 5月13日下昼音信,当天在 FORCE LINK AI 转变巡展·上海站,火山引擎官方线路,新发布的豆包1.5·视觉深度想考模子(Doubao-1.5-thinking-vision-pro),激活参数仅20B世博APP下载(官方)网站,但具备高大的多模态意会和推理才气,在60个公开评测基准中,有38个赢得 SOTA 阐明,在视频意会、视觉推理、GUI Agent才气等方面均处于第一梯队。当今,该模子已在火山方舟上线。
在视频意会方面,相沿动态帧率采样,视频时序定位才气权臣增强,聚会向量搜索,可精确定位视频中与文本形容相对应的片断。
同期,新增视频深度想考才气。模子学习了数万亿多模态象征数据,掌持通常视觉学问,聚会强化学习,使视觉推理才气大幅擢升。举例,在复杂的图形推理题中,模子建议假定,进行推理进修,当发现和假定不相通时,还能进行束缚反想,建议新的料到,直到得出正确谜底。
此外,该模子新增GUI Agent才气。基于高大的GUI定位性能,可在PC端、手机端等不同环境中完成复杂交互任务。举例,可对新建筑的APP功能进行自动化检测,当今该功能也曾利用于字节突出多款APP居品的建筑测试中。(罗宁)
包袱剪辑:刘万里 SF014
【免责声明】本文仅代表作家本东谈主不雅点世博APP下载(官方)网站,与和讯网无关。和讯网站对文中述说、不雅点判断保持中立,分离所包含实质的准确性、可靠性或完好性提供任何昭示或暗意的保证。请读者仅作参考,并请自行承担总计包袱。邮箱:news_center@staff.hexun.com
Powered by 世博APP下载(官方)网站/网页版登录入口/手机版APP下载 @2013-2022 RSS地图 HTML地图