黄色幽默 又立异高,阿里通义开源模子Qwen2.5参加大模子盲测全球前十
9月29日音书,基准测试平台Chatbot Arena日前公布最新大模子盲测榜单,近日发布的阿里通义千问开源模子Qwen2.5再次闯入全球十强,其大说话模子Qwen2.5-72B-Instruct排行LLM榜单第十,是前十中独一的中国大模子;Qwen系列视觉说话模子Qwen2-VL-72B-Instruct排行Vision榜单第九,是得分最高的开源大模子。
团结技能,全球开源社区基于Qwen系列二次树立的繁衍模子数目破损7.43万,高出Llama系列繁衍模子的7.28万。通义千问Qwen成长为天下最大的生成式说话模子族群,在Hugging Face社区的开源模子巨擘榜单Open LLM Leaderboard上,Qwen系列过火繁衍模子包揽了前十总共座席。
不论是模子性能仍是生态影响力,Qwen王人创造了中国开源大模子的历史。
Qwen2.5-72B-Instruct排行Chatbot Arena大说话模子榜单第十
Chatbot Arena是由怒放筹谋机构LMSYS Org推出的大模子性能测试平台,自2023年5月推出以来,一直是天下顶级大模子的最攻击竞技场。平台现在集成了全球70多个大模子,接收匿名口头将大模子两两组队,交给用户进行盲测,用户笔据委果对话体验对模子才调进行投票。
9月19日发布的Qwen2.5飞速进榜,旗舰模子Qwen2.5-72B-Instruct得分位列LLM榜单第十,居于OpenAI的o1、GPT-4o等模子之后,是得分最高的中国大模子;同天,开源的视觉说话模子Qwen2-VL-72B-Instruct闯入Vision榜单第九,略逊于GPT-4o、Gemini-1.5-Pro等闭源模子,是得益最好的开源模子。此前,Qwen系列已有多款开源模子闯入Chatbot Arena榜单。
春色影院Chatbot Arena官方发文,Qwen2-VL-72B-Instruct是排行最高的开源视觉说话模子
Qwen2.5的发布在海表里开源社区激发一场狂欢,这套开源模子涵盖多个尺寸的大说话模子、多模态模子、数学模子和代码模子,险些通盘尺寸的模子王人完了了同等领域业界最好性能,发布10天地载量向上150万。有国外树立者赞叹通义千问称得上是信得过的“怒放AI”,灵验户测评发现Qwen2.5从0.5B到72B王人是SOTA水平,于是发起话题:“公共王人用Qwen2.5替换了哪些常用模子?”
国际开源社区盛赞Qwen2.5