根据IDC半年度全球大数据和分析开支指南,IDC预测大数据和业务分析(BDA)收入到2017年将达到1508亿美元,相比2016年增长12.4%。BDA相关硬件、软件和服务的商业采购预计到2020年前将保持11.9%的复合年增长率,收入将超过2100亿美元。
IDC分析和信息管理副总裁Dan Vesset表示:“在经过多年的采用S曲线之后,大数据和业务分析解决方案终于步入了主流。BDA作为决策支持和决策自动化的推动技术,现在已经受到了高层管理者的关注。这一类解决方案也是在全球各行业和业务流程实现数字化转型的关键支柱之一。”
2017年将在大数据和业务分析解决方案上投资最多的行业包括银行、离散制造、制造流程、联邦/中央政府、专业服务。综合起来,这五个行业今年在BDA上将支出724亿美元,这几个行业在2020年的支出也是最高的,总投资额将达到1015亿美元。BDA开支增长最快的行业包括银行(复合年增长率13.3%)、医疗、保险、证券和投资服务、电信,每个行业复合年增长率都是12.8%。不过需要指出的是,IDC BDA开支指南覆盖的所有行业中,除了两个行业之外,其他所有行业在2015年到2020年期间都将实现两位的复合年增长率。
“构成金融服务板块的三大领域,银行、保险、证券和投资服务,这些都显示出未来大数据和业务分析支出的巨大希望,这项技术可以运用于这些金融机构的关键用例中,从欺诈检测和分享管理,到增强和优化客户的体验,”IDC客户洞察和分析项目总监Jessica Goegpert这样表示。
他补充说:“除了金融服务,其他几个行业也展现引人注目的机会。例如在电信行业,大数据和分析被用于维护和获得新客户,以及用于网络容量规划和优化。与此同时,由于数字化和大规模内容消费,媒体行业最近几年一直受到困扰。这方面,大数据和分析可以帮助企业利用并监控读者的习惯、偏好和情绪。厂商们可以利用这些大数据和分析的机会,很好地围绕这些行业优先级、痛点和用例制定各种信息。”
IT和商业服务将主导BDA的技术投资,这部分将在2017年和预测期内占到所有大数据和业务分析收入的一半多。服务相关的开支也将有最强劲的增长,5年期内复合年增长率为14.4%。到2020年软件投资将增长到超过700亿美元,其中最终用户查询、报告、分析工具和数据仓库管理工具为主。随着企业扩大他们的大数据和分析项目,非传统分析数据存储库和认知软件平台将实现最大幅的增长(复合年增长率分别为38.6%和23.3%)。BDA相关的服务器和存储采购将增长9%,到2020年达到296亿美元。
从公司规模的角度来看,超大规模企业(超过1000名员工)在预测期内将占60%多的BDA开支份额,IDC预计这类公司到2018年将超过1000亿美元。中小型企业也将是BDA支出的主要贡献者,全球收入中有近1/4来自规模小于500人的企业。
从区域角度来看,2017年美国将成为大数据和业务分析解决方案的最大市场,支出将达到788亿美元。第二大地区是西欧,2017年支出将达到341亿美元,其次是亚太(APeJ,不包括日本)为136亿美元。拉丁美洲和APeJ的BDA支出增幅最高,5年复合年增长率分别为16.2%和14.4%。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。