根据 Oracle 和《纽约时报》(New York Times) 畅销书作者 Seth Stephens-Davidowitz 共同开展的《决策困境》 (The Decision Dilemma) 研究发现,人们在使用数据制定决策时通常会感到迷茫,影响了他们的生活质量和业务绩效。该项研究对包括中国在内的 17 个国家/地区的 14,000 多名员工和企业负责人展开调研。研究结果显示,人们不得不做出比以往更多的决策,在生活和职业生涯中普遍面临决策困境,以下为来自中国受访者的研究数据。
随着决策次数的增加,拥有更多数据却适得其反
面对海量的数据,人们会感到穷于应付,失去对数据的信任,导致决策过程更加复杂,并对他们的生活质量产生负面影响。
决策困境造成组织惰性
企业领导者希望获得数据的助力,他们清楚知道数据对于组织的成功至关重要,但尚缺助力成功的工具,削弱了他们的信心和及时做出决策的能力。
数据必须与决策相关,否则人们会放弃决策
数据收集和分析对企业领导者来说关系重大。
数据科学家兼《人人都在说谎》(Everybody Lies) 和《别相信你的直觉》(Don’t Trust Your Gut) 作者 Seth Stephens-Davidowitz 表示:“人们正在被数据淹没。这项研究强调了一个人在普通的一天中接收的大量信息,包括互联网搜索、新闻提醒、朋友评论等。这些信息加起来,经常会超出大脑的处理能力范围。因此,人们倾向于排除令人困惑、有时甚至会相互冲突的数据,凭着直觉做出决定,但这可能是一个很大的错误。事实已经一次又一次地向我们证明,我们的直觉会有很大误导性,而明智的决策需要在正确理解相关数据的情况下才能实现。企业需要寻找一种方法来处理手头上的数据流,以区分信号和噪音,这是至关重要的第一步。”
Oracle红牛车队主席兼首席执行官 Christian Horner 表示:"当我们的车手以每小时200多英里的速度比赛时,他们必须非常迅速地做出关键且正确的决策,如何时进站、哪条轮胎最适合赛道上的条件,这可能决定了输赢。凭借Oracle云基础设施远程软件服务 (Oracle Cloud Infrastructure, OCI),我们的团队可以通过在大奖赛周末期间运行数十亿次的比赛策略模拟,确保我们根据赛车的性能、赛道上发生的变化以及比赛中竞争对手的行动做出明智的决策。"
店匠科技(Shoplazza) CTO夏冰表示:“我们以技术和数据为导向,科学系统化地提升跨境电商企业的出海效率。借助甲骨文强大的数据管理能力,我们在保障业务安全稳定的同时,还将助力跨境电商企业更好地利用数据做出正确决策,抓住商机,实现海外业务发展。”
AdTiming 首席技术官张文涛表示:“作为全球智能营销平台,我们致力于帮助移动应用开发者获取更高广告收益、提升广告体验,这其中数据收集与分析对于营销决策至关重要。云技术与人工智能的深度融合,将大幅提升数据驱动型决策能力,助力我们为全球客户提供了更为智能、高效的营销服务。”
甲骨文公司高级副总裁及亚洲区董事总经理李翰璋表示:“随着数字经济的飞速发展,企业需要更多的相关数据来获得全局视图。对于负责制定决策的企业领导者而言,如果忽视这些数据,就需自担风险。这项研究指出,企业领导者需要重新思考对待数据和决策的方法,其中关键的一点是将数据从洞察到决策再到行动中连接起来,而Oracle云技术内嵌机器学习和人工智能,充分支持基础数据管理、增强和应用分析、运营应用套件,能够有效满足这一需求。”
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。