至顶网软件频道消息:2010年推出的Instagram是一款分享照片和视频的社交应用。如今,Instagram拥有8亿月活跃用户,并且归Facebook拥有。每天有7000万张照片上传到Instagram,人们通过这些照片和文字进行互动,评论和使用标签,用心表达情感。所有这些都会创造大量的数据。这些数据经过分析——并且越来越多地通过人工智能算法进行分析——可以为人类行为提供令人难以置信的商业智能和洞察,因此Instagram首席执行官Kevin Systrom说:“我们也将成为一家大数据公司。”
下面就让我们来看看Instagram是如何使用大数据和人工智能的。
探索页面和搜索功能
通过使用标签和趋势信息,Instagram用户可以找到特定活动、主题或事件的照片,或者发现世界各地的各种体验、餐馆和地点。搜索工具可使用标签,帮助Instagram用户在数百万上传的图像中发现他们感兴趣的内容。
目标广告
为了让Instagram收集的数据具有价值,就必须从中提取出客户洞察。通过评估用户的搜索偏好和参与度分析,Instagram可以向那些想要得到特定客户资料、了解哪些客户可能对接收特定营销信息最感兴趣的企业销售广告。Instagram的母公司Facebook拥有18亿用户,因此他们具有强大的分析信息网络,可根据人们喜欢的内容、他们关注的人以及与之互动并保存的内容来推送定位广告。
增强用户体验
为了确保用户在平台上找到有价值的信息,Instagram向他们展示他们喜欢的内容,就变得很重要。随着内容不断增加,查找与每个用户相关的内容就变得越来越有挑战性。当Instagram将反馈按时间顺序显示,改为显示他们认为用户可能喜欢和愿意分享的帖子时,就可以使用机器学习算法,来帮助对信息进行分类,并随着时间的推移,更好地了解每个用户最重要、最相关的内容是什么,从而创建个性化的信息流。
过滤垃圾邮件
Instagram使用人工智能来对付垃圾邮件。垃圾邮件过滤器能够从包括英文、中文、俄文、阿拉伯文等9种语言帐号中删除伪造的邮件。一旦检测到消息,就会被自动删除。 Instagram使用Facebook的DeepText人工智能算法,这种算法在理解消息上下文方面的表现几乎可以媲美人类。
打击网络欺凌和删除攻击性评论
在由Ditch the Label进行的一项调查中,有超过1万名12至25岁的英国青年中,有42%的人表示Instagram是他们最受欺凌的平台。因为被视为网络欺凌问题最严重的社交媒体网站,Instagram因此成为第一个使用机器学习自动删除攻击性帖子的公司,而Facebook和Twitter主要依靠用户报告有滥用语言的情况。基于使用DeepText识别垃圾邮件并将其删除方面所取得的成功,Instagram开始将其视为识别和消除违反Instagram社区准则评论的一种解决方案。人类员工会检查并标记实际的Instagram帖子,帮助DeepText了解在某些情况下被视为冒犯性的内容,以及不属于冒犯性的内容。如果算法发现某些令人反感的内容,就会立即删除。
尽管DeepText并不完美,但这一算法已经得到网络预防组织对其发挥作用的赞誉。目前还存在误将某些并非冒犯性评论错误分类为冒犯性内容的风险。
研究人类
在一项研究中,有1亿张Instagram照片被用来训练全球服装模式。由于机器学习的原因,有海量的数据需要经过审查。这项研究表明,机器学习在研究人类以及世界各地的社会、经济和文化因素并提取见解方面能起到一定的帮助作用。这项研究展示了大数据以及计算机视觉、自动分析算法和机器学习等技术在处理由社交媒体网站生成的庞大数据集、了解我们周围世界方面具有的强大能力。
从增强用于用户和广告的平台,到查找和删除虚假或冒犯性内容,Instagram利用从所有数据中心提取的信息来改善自我,同时也有其他一些公司在Instagram收集的大量数据中发现了具有巨大潜力,可以用来揭示人类行为、文化等等。
好文章,需要你的鼓励
五家光学存储初创公司正在开发长期存储技术,旨在用超过100年寿命的光学介质替代只有5-7年寿命的磁带。这些公司包括Cerabyte、Ewigbyte、HoloMem、Optera和SPhotonix,它们的技术类似微软Project Silica项目。光学存储介质具有更强的化学、冲击、辐射、水和热抗性,同时保持低能耗和高容量特性。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
Nutanix发布分布式主权云产品组合更新,为多云环境提供更安全的运营和管理功能。该解决方案支持企业在分布式环境中灵活部署和治理基础设施,运行传统虚拟机、现代云原生和AI应用。新功能包括支持完全断网环境的暗站点管理、政府云集群正式发布、Kubernetes平台增强安全合规性、企业AI平台集成NVIDIA微服务,以及云平台新增跨站点灾难恢复能力,为用户提供统一管理和运营简化体验。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。