据被称为21世纪的“石油”,对数据进行积累、分析、理解和有效使用所产生的价值在各行各业都已经被验证,而且不再只局限于某些大型企业。不同规模的组织机构、不同岗位上的工作人员都已经深谙这一点。
然而,虽然先进的数据技术被越来越多地使用,使用者的数据素养也不断提高,但仍有一些机构组织掉队了,例如公益组织,而这并非是公益组织缺乏使用数据工具、提高数据素养的意识,而是在能力和工具方面有所欠缺,所以还无法建立以数据为驱动的组织文化。
假设能够充分利用和释放数据的价值,公益组织和其他非营利机构想必能够极大提高运作和项目效率。但由于公益慈善领域通常需要各种审核和存档,这通常成为了公益组织购买数据工具方面的掣肘。
逐渐扩大的数据鸿沟
对公益组织而言,所获得的捐款或其他收入首要任务是回馈社区和人,这就意味着对新技术的投资和吸收高技能员工必须放在第二位。
如同数字鸿沟造成能上网的人比不能上网的人有着更大的优势,数据鸿沟也会对公益组织利用数据做好项目产生深远的影响。换句话说,假使公益组织无法获得数据驱动的洞察力,或无法有效地使用数据,他们的努力可能会受到严重阻碍。虽然这无关业界竞争,但对于利用数据来推动慈善、人道主义事业的进步是大为不利的。
能用、善用数据是关键
虽然有越来越多的公益组织通过数据来推动项目发展,但企业在这方面仍旧更占优势,很多企业已经在采用各种数据驱动型技术,如人工智能、物联网、数据分析等等,这些技术对于环保等项目上都能发挥巨大的用途。埃森哲最近的一份报告显示,有60%的机构在使用人工智能,53% 的机构使用数据分析和物联网来减少排放。要成功部署这些技术需要大量的数据,而且所有部门的员工都要具备数据知识,这样他们才能有效地使用这些工具。
更重要的是,公益组织的预算日渐紧缩,导致这些组织只能限制使用已有数据和工具,因此如何能够将现有数据和工具的价值最大化变得更加关键。如果利用创新工具生成数据的能力继续主要为企业所掌握,那么公益组织就必须专注于提高技能,使拥有的数据更加有效。
于今年年中发布的《中国公益组织互联网使用与传播能力第八次调研报告》显示,在中国公益组织中,有数字化规划和信息化规划的比例达45.25%,但不少机构在数字化和信息化方面投入的预算总体较低,没有预算的组织比例达到了39.36%。超8成机构在2022年并没有计划应用、部署、开发新的信息系统或数字化业务。
报告指出,公益组织的短板在于“数据分析能力”。 仅有23.18%的组织经常或有时对官方网站的数据进行分析(使用百度统计、站长网等工具),多数组织从不或很少对官方网站数据进行分析。同时,对微博、微信、短视频平台的数据及筹款数据的比例都较低。这也是公益组织数字化进程中的一大能力制约因素。
责任当前,谁应该站出来?
公益组织是真正在推动社会发生积极变化的机构,因此帮助他们符合所有人的利益。而企业主要是为了改善其环境、社会和治理(ESG)方面的表现,在商业利益面前,社会利益始终是放在第二位。
这种情况下,政府在向公益组织提供具体支持以提高其数据素养方面可以发挥作用,而且,在数据素养方面,各方有着很大的合作空间。例如,非营利组织可以利用企业的数据专业知识和资源,而合作的同时可以为企业提供机会,将合作纳入企业现有的ESG项目,营造双赢的局面。
总而言之,公益组织需要各方的大力支持,帮助他们释放数据的力量来应对最严峻的全球性挑战。可以设想一下,如果慈善机构和非政府组织能够提高数据素养,充分利用所拥有的信息,他们将能取得怎样的成就?数据技能的缺失,未来可能更广泛的数据鸿沟,将大大阻碍公益组织的工作效率,这是所有人都不愿意看到的。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。