国产大模型阵营再添新锐选手。11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级,加速迈向年轻人工作、学习、生活的AI助手。
近期,在CMMLU权威大模型性能评测中,夸克大模型成绩位列榜首。最新评测显示,夸克大模型整体能力已经超过GPT-3.5,在写作、考试等部分场景中优于GPT-4。
国产自研大模型中的“学霸”
夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供AIGC、智能检索的专业服务。

性能方面,凭借语义理解、逻辑推理、内容生成等技术优势,夸克大模型在CMMLU权威榜单的最新评测结果中,取得排名第一的优异成绩。在国内专业考试测试中,夸克大模型高考成绩接近满分,并以486分的高水平通过临床执业医师资格考试,是名副其实的“学霸”。
同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知识能力方面,夸克大模型拥有广泛的知识覆盖、上下文理解、创造性表达、信息搜集和整合、多语言支持等,同时具备外接专业知识增强、检索增强能力,进一步提升跨领域、时效性的知识和语言理解能力。此外,夸克大模型还具有撰写各类文本的强大文学创作能力,以及准确、合理、连贯的对话回复能力。
整体能力超过GPT-3.5,部分场景优于GPT-4,夸克大模型能力“爆表”源于数据、行业、知识正确性、平台等四方面优势。首先,夸克大模型拥有最全面的中文数据库,能更好地理解、评估、提炼中文知识体系;第二,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,沉淀了非常丰富的数据及用户场景;第三,在通用知识、写作增强等方面,夸克建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。第四,夸克组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。
据介绍,坚持自研大模型的研发路线是服务于夸克的业务战略,也是持续推动夸克App在产品体验创新和迈向新一代搜索的技术底座。
夸克将借助自研大模型全面升级
今年以来,人工智能技术已经逐步融入到夸克App的产品迭代中。夸克扫描王能够在复杂场景下模仿人类思维,更精准地识别、分析和提取文字、公式及图片,实现更完美的扫描效果。夸克网盘上线的AI自然语言搜索功能,仅通过模糊词、形容词等关键信息,就能快速找到照片、文档等云端资料,进一步提升搜索效率。
作为最受年轻人青睐的智能产品,夸克App为数千万95后职场人和大学生提供了跨场景的智能效率工具。根据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示,夸克App在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。
据悉,夸克大模型将会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。未来,夸克大模型应用于搜索、智能工具和资产管理助手等场景,一系列AI原生应用将为年轻人工作、学习、生活提供更全面的服务。
今年9月,阿里集团宣布了用户为先、AI驱动的两大战略重心,将加大对“技术驱动的互联网平台业务”、“AI驱动的科技业务”等业务的战略性投入。近日举办的2023世界互联网大会上,阿里巴巴集团CEO吴泳铭预判,在可见的未来,会有更智能的下一代产品进入人们的生活,AI助理会无处不在,成为每个人工作、生活、学习中的助手。
“AI时代已经来临,大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的AIGC技术将会给搜索产品带来全新变化,加速迈向下一代搜索。夸克借助自研大模型将全面升级,全新的夸克很快会和大家见面。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。