世界上最大的四家科技公司正在合作开发一项新的开源计划,旨在让网络更具竞争力。
谷歌、Facebook、微软和Twitter正式启动了名为Data Transfer Project的项目,以提供在线平台之间迁移数据的工具。他们认为,更容易切换服务,能够在为消费者提供更大灵活性的同时,让供应商可以在更公平的竞争环境中展开业务。
来自谷歌的两位工程师Brian Willard和Greg Fair在博客文章中详细介绍了该项目背后的愿景。“这个被称为‘数据可移植性’的想法让人们可以更好地控制他们的信息,并促使我们开发出优秀的产品,因为我们知道他们可以随时收拾好离开我们。从服务方面来说也将受益,因为服务提供商可以参与竞争让用户更轻松地迁移数据。”
从很多方面来说,Data Transfer Project是现有谷歌和很多Web公司提供的数据导出工具的一个演变。这些工具让用户能够轻松下载照片等内容,但通常不会提供将文件移动到其他服务中的简单方法。迁移联系人、日历条目以及其他与特定平台绑定的信息,都是很困难的。
Data Transfer Project项目旨在通过使企业能够在其平台之间实施信息“适配器”来应对这一挑战。目前,有七家厂商提供该服务,包括谷歌、微软、Twitter、Flickr、Instagram、待办事项应用程序Remember the Milk、以及最近收购了Flickr的照片共享公司SmugMug。
参与该计划的技术巨头们也发布了一份白皮书,指导其他公司建立属于自己的适配器。为了交换信息,两家企业必须同意允许其服务之间的内容转移,并要求个人独立地验证每个帐户。当一个人移动他们的数据时,所有东西都需要使用唯一的加密密钥进行加密。
谷歌公司工程师Brian Willard和Greg Fair写道:“所有证书和用户数据都将在传输和静止时加密。该协议使用一种完美的前向保密形式,每次传输会生成新的唯一密钥。此外,该框架允许合作伙伴支持他们所选择的任何授权机制,这使合作伙伴能够在授权帐户时利用其现有的安全基础架构。”
Data Transfer Project项目正在积极开发中,这意味着能够像最初预想得那样轻松切换在线服务之前,可能还有很长一段路要走。此外,还有很多是取决于顶级网络公司支持内容迁移的程度。最终实施该技术的一些公司可能仅限制对某些信息或服务的支持。此外,苹果公司显然没有参与该计划。
值得注意的是,几乎肯定这不仅仅是一次利他的举动。欧盟于5月生效的通用数据保护条例中包含了数据可移植性权利,因此尽管一些参与者长期支持这一概念,但大公司之间的协议无疑受到对谁拥有数据日益关注、以及人们对数据的控制程度的影响。
无论如何,该计划得到了科技行业最具影响力的四家公司的支持,这将大大推动行业对这一项目的兴趣。目前该小组已经为Data Transfer Project上线了一个专门的网站,并在GitHub上发布了源代码。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。