国产大模型 “学霸”来了阿里夸克自研大模型登顶权威评测榜单

近期，在CMMLU权威大模型性能评测中，夸克大模型成绩位列榜首。最新评测显示，夸克大模型整体能力已经超过GPT-3.5，在写作、考试等部分场景中优于GPT-4。

国产大模型阵营再添新锐选手。11月14日，阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型，将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级，加速迈向年轻人工作、学习、生活的AI助手。

国产自研大模型中的“学霸”

夸克大模型是基于Transformer架构、自主研发的多模态大模型，每天会对亿级的图文数据进行训练和精调，具有低成本、高响应、综合能力强等特点。同时，夸克大模型还将衍生出通识、医疗、教育等垂类模型，可以提供AIGC、智能检索的专业服务。

国产大模型 “学霸”来了阿里夸克自研大模型登顶权威评测榜单
性能方面，凭借语义理解、逻辑推理、内容生成等技术优势，夸克大模型在CMMLU权威榜单的最新评测结果中，取得排名第一的优异成绩。在国内专业考试测试中，夸克大模型高考成绩接近满分，并以486分的高水平通过临床执业医师资格考试，是名副其实的“学霸”。

同时，夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知识能力方面，夸克大模型拥有广泛的知识覆盖、上下文理解、创造性表达、信息搜集和整合、多语言支持等，同时具备外接专业知识增强、检索增强能力，进一步提升跨领域、时效性的知识和语言理解能力。此外，夸克大模型还具有撰写各类文本的强大文学创作能力，以及准确、合理、连贯的对话回复能力。

整体能力超过GPT-3.5，部分场景优于GPT-4，夸克大模型能力“爆表”源于数据、行业、知识正确性、平台等四方面优势。首先，夸克大模型拥有最全面的中文数据库，能更好地理解、评估、提炼中文知识体系；第二，夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料，沉淀了非常丰富的数据及用户场景；第三，在通用知识、写作增强等方面，夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。第四，夸克组建了数百人的研发团队，在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。

据介绍，坚持自研大模型的研发路线是服务于夸克的业务战略，也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。

夸克将借助自研大模型全面升级

今年以来，人工智能技术已经逐步融入到夸克App的产品迭代中。夸克扫描王能够在复杂场景下模仿人类思维，更精准地识别、分析和提取文字、公式及图片，实现更完美的扫描效果。夸克网盘上线的AI自然语言搜索功能，仅通过模糊词、形容词等关键信息，就能快速找到照片、文档等云端资料，进一步提升搜索效率。

作为最受年轻人青睐的智能产品，夸克App为数千万95后职场人和大学生提供了跨场景的智能效率工具。根据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示，夸克App在泛学生人群和新生代职场人群的用户占比最高，年轻用户使用时长位列行业第一。

据悉，夸克大模型将会优先落地在通识问答、专业搜索等信息服务领域，满足年轻人学习知识和提升自我的需求。未来，夸克大模型应用于搜索、智能工具和资产管理助手等场景，一系列AI原生应用将为年轻人工作、学习、生活提供更全面的服务。

今年9月，阿里集团宣布了用户为先、AI驱动的两大战略重心，将加大对“技术驱动的互联网平台业务”、“AI驱动的科技业务”等业务的战略性投入。近日举办的2023世界互联网大会上，阿里巴巴集团CEO吴泳铭预判，在可见的未来，会有更智能的下一代产品进入人们的生活，AI助理会无处不在，成为每个人工作、生活、学习中的助手。

“AI时代已经来临，大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信息事业群总裁吴嘉表示，基于大模型的AIGC技术将会给搜索产品带来全新变化，加速迈向下一代搜索。夸克借助自研大模型将全面升级，全新的夸克很快会和大家见面。

来源：业界供稿

0赞

好文章，需要你的鼓励

国产大模型 “学霸”来了 阿里夸克自研大模型登顶权威评测榜单

来源：业界供稿

2023

11/14

15:11

分享

点赞

全国首批10城菁彩Vivid影厅启幕，《山河故人》重映见证影像新纪元

工业和信息化部人形机器人与具身智能标准化技术委员会成立大会暨第一次全体委员会议召开

生命科学计算测试专委会正式成立，BioProfile框架引领行业标准建设

超智算完成北京核心智算中心资产收购，加速构筑“3+X”全国算力网络新格局

走出“参数崇拜”：联想用“一体多端”重塑“人的尺度”

从“单点突破”到“一体多端”：拆解天禧AI 3.5进化背后三年的进化哲学

openGauss Summit 2025在京召开，加速行业智能化变革，共建繁荣数据库生态

2025联想天禧AI生态伙伴大会：天禧AI一体多端，与开发者共建个人AI生态

西班牙病毒如何将谷歌带到马拉加

LangChain核心库曝出严重漏洞，AI智能体机密信息面临泄露风险

Mill如何与亚马逊和全食超市达成合作协议

TechCrunch创业大赛中的9家顶尖生物技术初创公司

DeepSeek之后，中国人形机器人以“群体智能”再次掀起技术浪潮

QwQ-32B模型成本地部署福音，通义App可第一时间体验

入局智驾的印奇，看到了怎样的未来？

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

千里科技亮相吉利AI智能科技发布会，共启“AI+车”新纪元

天翼云CPU实例部署DeepSeek-R1模型最佳实践

京东云与宝德计算战略签约，共绘分布式存储与智算新未来

夸克AI搜索上线“深度思考”：答案详尽、全面、可信任

全球AI顶会AAAI 2025 在美开幕，产学研联手的“中国队”表现亮眼

蚂蚁数科提出创新跨域微调框架ScaleOT入选全球AI顶会AAAI 2025

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

国产大模型 “学霸”来了阿里夸克自研大模型登顶权威评测榜单