至顶网软件频道消息: IBM研究员推出了一项云分析服务,将应用与一系列大型地理空间数据集连接起来,这些数据集涵盖地图、卫星、天气和人口变化等。
该服务被称为PAIRS Geoscope,开发人员可使用IBM的REST API来为该服务添加基于地理空间和时间的数据到他们自己的应用中。
PAIRS Geoscope目前仅限科学家使用,但IBM研究院现在已经上线了一个网站,供所有开发人员测试该资源。
PAIRS是Physical Analytics Integrated Repository and Services的缩写,是IBM应对混合大型结构化数据集(如卫星和天气数据)与非结构化数据(如推文中的位置和时间戳数据)挑战所做出的回应。
IBM Watson研究人员在2015年的一篇论文中首次描述了这种PAIRS集成引擎,并指出PAIRS是基于大数据技术Hadoop和HBase构建的。可以承担数据采集中的"苦力工作",并在多个数据源跨多种数据格式对分析洞察进行搜索。
IBM PAIRS有很多可用的数据集,包括美国航空航天局Aqua和Terra卫星数据、美国政府的土壤数据、NOAA天气预报、美国地质调查局Landsat数据等等。
Google在2016年推出地理空间服务,2016年开始让开发人员可以访问Landsat和欧盟Sentinel-2卫星图像,其中包含近1.5PB的数据。Google Earth的两个关键数据集引入Google Cloud,使得开发人员能够利用机器学习和计算引擎工具构建预测服务。
2016年,IBM研究人员还开始从大疆Phantom 3 Standard收集的无人机地球图像,并将其上传到PAIRS,在PAIRS图像与其他数据源相匹配,以便与土壤属性、卫星和天气等数据进行叠加。
PAIRS用户还可以上传专有数据以与现有数据层相结合,例如,结合物联网传感器数据。此功能在物联网部署中可以发挥作用,例如可用于测量土壤湿度以预测灌溉需求。
事实上,PAIRS可以追溯到IBM协助美国大型葡萄园E&J Gallo Winery开发的一个物联网精确灌溉系统。数以百计的传感器、卫星图像和云通信网络结合天气、气象和大气数据,以帮助监测植被、估计水分损失并预测未来的灌溉需求。
IBM表示,已经与农业、金融、能源和气象等领域的客户进行了试验性的平台部署。PAIRS存储库的数据量每天增长数TB。据IBM称,PAIRS可以"自动摄取、管理和无缝集成各种形式的地理空间和时间数据",将大型、异构和复杂的数据集"转换为一个整齐排列的索引结构,专为高效检索和查询而设计"。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
时尚零售巨头维多利亚的秘密因安全事件导致网站和线上订单服务中断,已立即启动应急响应、邀请第三方专家协助恢复运营,实体店仍正常营业。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。