最新文章
马斯克展示Grok-1.5 Vision:多模态,能理解真实世界

马斯克展示Grok-1.5 Vision:多模态,能理解真实世界

马斯克旗下AI公司x.ai推出Grok-1.5 Vision,具备视觉功能,能深度理解真实世界并进行数据解读、转换。Grok-1.5 V在多模态模型测试中超过GPT-4V等竞品,展示了强大的理解、数据转换和检索能力,如将图片翻译成Python代码。即将向早期测试者和现有用户推出。

有大学老师正用ChatGPT批改论文,让同学也这么做!

有大学老师正用ChatGPT批改论文,让同学也这么做!

4月7日,CNN消息,美国伊萨卡学院-战略传播学教授Diane Gayeski,正在使用ChatGPT批改学生的论文。

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI在官网宣布新增6个全新微调API功能,以扩展自定义模型,帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。

Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数
2024-04-07

Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数

据悉,Command R+有1040亿参数,支持英语、中文、法语、德语等10种语言。最大特色之一是,Command R+对内置的RAG(检索增强生成)进行了全面强化,其性能仅次于GPT-4 tubro,高于市面上多数开源模型。

“弱智贴吧”的数据,居然是最强中文语料库

“弱智贴吧”的数据,居然是最强中文语料库

在大模型领域英语一直是训练数据最重要的语言,但由于中英文的结构和文化差异,直接将英文数据集翻译成中文并不理想。所以,为了填补高质量中文数据集的空白,研究人员开发出了COIG-CQIA数据集。

Sora并非完美,致命缺点也很多

Sora并非完美,致命缺点也很多

华尔街日报科技专栏作家Joanna Stern专访OpenAI首席技术官Mira Murati,讨论全球爆火的文生视频模型Sora。访谈中,Mira回应了Sora的缺点、训练数据来源、上市时间以及生成内容的安全性等问题。Sora存在诸如理解提示文本不准确、物体控制不稳定等问题,且算力需求巨大,短期内不会上市。Sora的训练数据来自Shutterstock,未来可能推出视频修复功能。

AGI万字长文(上) | 2023回顾与反思

AGI万字长文(上) | 2023回顾与反思

2023年大众对AI的看法从怀疑到认可,AGI(通用人工智能)的发展迅速,大模型展现出惊人的想象力和取悦能力。应用层尚未出现独角兽,创业者面临官方技术迭代的挑战。

Llama-3公布基础训练设施,使用49,000个H100

Llama-3公布基础训练设施,使用49,000个H100

Meta宣布了两个新的24K H100 GPU集群,用于训练大模型Llama-3,预计4月末或5月中旬上线。集群使用RoCEv2网络和基于Tectonic/Hammerspace的存储解决方案,支持PyTorch。

马斯克将在本周,开源类ChatGPT产品Grok

马斯克将在本周,开源类ChatGPT产品Grok

马斯克宣布将开源其公司xAI发布的生成式AI产品Grok,一款类ChatGPT产品,提供文本、代码生成等功能,性能超GPT-3.5但弱于GPT-4。Grok-1在多个测试平台表现优异,但仍有局限性,如需内容审核,无独立搜索能力。

文本+图片生成高保真视频,阿里推出视频模型AtomoVideo

文本+图片生成高保真视频,阿里推出视频模型AtomoVideo

阿里巴巴技术团队推出AtomoVideo,一种文本+图片生成高保真视频的模型。AtomoVideo通过融合多粒度图片注入和时间建模技术,使用预训练的Stable Diffusion 1.5和CLIP编码器,提高视频与原始图片的一致性。

英伟达推出”生成式AI专业认证“,帮你成为大模型开发专家!

英伟达推出”生成式AI专业认证“,帮你成为大模型开发专家!

英伟达推出了生成式AI(AIGC)专业认证,旨在通过考试提供行业认可的权威证书,并提供相应的培训课程。认证内容涵盖生成式AI和大语言模型知识,考试为远程方式,适合多种AI相关职业人士。

OpenAI公布2015—2018年重要邮件,回应马斯克起诉

OpenAI公布2015—2018年重要邮件,回应马斯克起诉

OpenAI官网公布了马斯克与联合创始人的邮件,揭示马斯克对OpenAI的控制欲和与特斯拉合并的想法。马斯克认为OpenAI需要每年数十亿美元才能与谷歌竞争,但最终因对控制权的分歧离开了OpenAI。

一张草图直接生成视频游戏,谷歌推出生成交互大模型

谷歌DeepMind推出Genie,一个无需数据标记、无监督训练的生成交互模型,具有110亿参数,能基于图像、照片或草图生成可控制动作的视频游戏。Genie通过大规模训练,学习潜在动作关系,可应用于其他领域。