至顶网软件频道消息:也许每个人都记得曾经反复购买Fleetwood Mac乐队《Rumors》专辑的日子,黑胶唱片、盒式磁带、CD、迷你光盘和数字下载,这些形式的不断变化证明音乐行业一直在不断地发展,而这种发展通常是以粉丝作为代价。值得庆幸的是,反复购买同一张专辑的日子早已不复存在了。但这并不意味着音乐流媒体的勇敢新世界可以停滞不前,这意味着无法满足用户不断变化的品味和不断提高的期望。
自2008年推出以来,Spotify已经建立了一个平台,拥有2亿活跃用户,可以即时访问大约4千万条音乐曲目。据Spotify网站称,它已经成为音乐行业最重要的收入来源。但在数字世界中,任何人都可以记录自己的内容,这个行业和用户的需求正在发生变化。
Spotify的成功核心是用户生成的内容。精心策划和共享的播放列表是一些人拒绝迁移到Apple Music等其他服务的重要原因之一。但是许多用户正在扩大他们的视野,并选择通过收听播客来学习和增强他们的知识,而不是反复收听他们国家的十大热门歌曲。
但是,如果我们更仔细地观察的话,很容易看出技术正在改变音乐行业的每个元素,从音频内容的创作、传递、推广到消费的每一个环节。我们很容易将人工智能(AI)、增强现实(AR)、机器学习和区块链视为另一波技术流行语,但是它们远远不止于此。
人工智能艺术家和电影制片人Taryn Southern借助新兴技术,改进整个创作过程。她的专辑《I AM AI(我是人工智能)》利用了人工智能软件,包括Amper Music,IBM的Watson Beat、谷歌的NSynth和AIVA。但是Taryn才刚刚开始进行创作过程的数字化转型。
伴随着Taryn单曲的音乐视频也使用了AR、VR和360° 视频技术。不满足于创造第一个独唱艺术家和人工智能的合作,Taryn还继续制作区块链歌曲,这是第一首用以太坊智能合约进行标记的歌曲。
有超过240人合作创作了这首歌的歌词,并部分拥有这首歌。每位参与者都通过Trust Token从歌曲的销售和流媒体服务销售中获得版税,版税会支付到他们的以太坊钱包。我们经常会读到技术是如何鼓励工作场所的全球协作。而Taryn已经证明了将AR、VR、人工智能和智能合约引入艺术创作过程每个阶段的可能性。
Pandora的建议歌曲、Spotify的每周发现以及JioSaavn的混音功能都是流媒体公司如何使用人工智能和机器学习来构建强大的个性化功能的例子。每天有超过30万首歌曲上传到互联网。不幸的是,其中高达99%的歌曲仅仅因为不受歌迷关注或者被错误分类而无法被发现。
算法可以帮助对符合我们的收听偏好的歌曲进行聚类,并为数百万用户提供这样的帮助。有一些应用程序(例如:muru音乐)通过声称自己是第一个人工智能DJ功能,将个性化提升到一个全新的水平。这些应用程序利用技术来学习成为优秀DJ的艺术,并将这种技巧转化为一系列算法和规则集。它们让任何用户都可以选择流媒体服务,并选择流派和艺术家,然后就可以在几秒钟内生成个性化的播放列表。虽然混音专辑只是一个遥远的记忆,但是新一代的人工智能DJ保留了完美定制音乐体验的艺术。
在一个数字原生代对没有时间阅读感到内疚的世界中,播客和有声读物使人们能够在日常生活中所谓的死亡时间内学习。上班通勤的途中、可怕的健身课程中、遛狗甚至是家务劳动的时间都可以转化为学习机会。但这些变化对Spotify等音乐流媒体服务意味着什么呢?
当Spotify掀起收购狂潮,花费超过4.3亿美元购买Gimlet、Anchor和Parcast的时候,引起了一些人的注意。该公司还表示他们预计今年进一步的交易将使其支出高达4亿至5亿美元。很明显,Spotify已经着眼于从单纯的音乐服务发展到流媒体业务。
音乐的创作过程和发行只是音乐产业如何以极快的速度继续发展的起点。我们的播放列表现在由虚拟DJ精心策划,全球社区可以无缝协作创建可在世界各地欣赏的专辑。
然而,我们对音频的热爱并不仅限于音乐。独特和真实的用户生成内容的兴起迫使音乐流媒体服务也推广播客和有声读物。人们常说,将人们聚集在一起并从其他人的故事中学习时,技术最有效,而通勤途中的体验就是一个完美的例子。
如果我们回顾从1877年——托马斯.爱迪生首次发明留声机——到现在的旅程,很容易看出音乐行业比Spotify或Apple Music订阅要大得多。技术始终在推动创新,并帮助行业发展到现在的状态。但我有一种感觉,我们才刚刚开始。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。