阿里云推大规模视觉语言模型开源,支持中英文多种语言
【资料图】
阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScope开源。此前,阿里云已经开源了通用模型Qwen-7B和对话模型Qwen-7B-Chat。Qwen-VL是一款支持中英文等多种语言的视觉语言模型,相较于此前的视觉语言模型,除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。Qwen-VL以Qwen-7B为基座语言模型,在模型架构上引入视觉编码器,使得模型支持视觉信号输入,该模型支持的图像输入分辨率为448,此前开源的视觉语言模型通常仅支持224分辨率。官方表示,该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景,在主流的多模态任务评测和多模态聊天能力评测中,取得了远超同等规模通用模型的表现。在Qwen-VL的基础上,通义千问团队使用对齐机制,打造了基于语言模型的视觉AI助手Qwen-VL-Chat,可让开发者快速搭建具备多模态能力的对话应用。通义千问团队同时表示,为了测试模型的多模态对话能力,他们构建了一套基于GPT-4打分机制的测试集“试金石”,对Qwen-VL-Chat及其他模型进行对比测试,Qwen-VL-Chat在中英文的对齐评测中均取得了开源视觉语言模型最好结果。
关键词:
相关阅读
-
阿里云推大规模视觉语言模型开源,支持...
阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScop -
核污染水不同于核废水
日本政府已于8月24日单方面强行启动福岛核事故污染水排海。面对国际社 -
中国空间站已开展上万次在轨实验
记者从中国科学院空间应用工程与技术中心获悉,中国空间站科学实验设施 -
性别大战!孙颖莎3-0横扫削球手马特 马...
性别大战!孙颖莎3-0横扫削球手马特马特被批丢男人的脸附视频,国乒,马 -
穿越海贼王加入草帽吃了金金果实的小说...
1、海贼王之我是最强海贼王之晶心动魄。相信通过穿越海贼王加入草帽这 -
沪宁股份:8月25日召开董事会会议
每经AI快讯,沪宁股份(SZ300669,收盘价:12 78元)8月27日晚间发布公
精彩放送
-
阿里云推大规模视觉语言模型开源,支持...
阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScop -
申鹤,但是半写实风【AI数雕壁纸】
胖爸使用Midjourney与Ps制作,可下载勿商用哦,转载请注明哟,给up亿点 -
我国将立法促进学前教育普及普惠安全优...
据新华社北京8月28日电学前教育是终身学习的开端,也是国民教育体系的 -
西南农业科技博览会在昆明开幕
近日,由云南省化工行业协会、云南省塑料行业协会等主办的西南农业科技 -
“认房不用认贷”将为购房者带来哪些实惠?
新华社北京8月28日电题:“认房不用认贷”将为购房者带来哪些实惠?... -
一条船能装多少个集装箱(一条船)
1、你好:2、河南方言,亲姐妹的丈夫们之间的互相的称谓,就叫“一... -
无痛分娩
分娩痛是分娩过程中的自然生理反应,曾经,人们把这种剧烈的痛苦视为不 -
万向钱潮:目前为特斯拉间接配套球笼、...
南方财经8月29日电,万向钱潮在互动平台表示,公司目前为特斯拉间接配 -
核污染水不同于核废水
日本政府已于8月24日单方面强行启动福岛核事故污染水排海。面对国际社 -
文化派出所:重拳出击护安宁
夏季治安打击整治行动开展以来,市公安局睢阳分局文化派出所立足本职重