至顶网软件频道消息:1844年,莫尔斯发出人类历史上的第一份电报:“上帝创造了何等的奇迹!”电报的发明,揭开了电信史上新的一页。现如今,随着信息技术的不断发展,和AI数据分析能力的飞速提升,大数据在今后可以创造出什么样的奇迹呢?
如今企业实施的大数据系统,大多展现的是一个非常炫酷的面板和一些看上去很吸引眼球的数据分析,但数据的实际应用价值并没有确切的体现。不能为了数据而数据,首先要了解需要用大数据解决的问题是什么,怎么来定义这些问题?把问题梳理清楚,然后基于这些问题,看看在数据上能不能做很多的启示,要从解决问题出发而不是为了数据而数据。
在利用大数据解决问题的时候,首先要看需要什么样的数据,用这些数据如何来解决我们的问题。其次,有了数据以后,怎么样去解放思想,创造新的应用价值。企业界和科研界可以合作解决这个问题。大数据是时代的特征,已经是事实的存在,而且数据应用的技术在那里,各种应用场景现在也都落地了。因此,CIO们不能为了大数据而大数据,而是思考到底应该做什么事情,有什么样的数据,需要什么数据,用这些数据怎么样把已有的工作做的更好,从而把新的应用推动起来。
华东师范大学教授钱卫宁的观点是,数据其实很像以前的电,有电之前跟有电之后应用是不一样的,有了电还是在用蒸汽机会觉得说这个电没有多大的作用。现在有了数据之后,可能说一个业务的模型或者决策的模型都要改变。所以就是说有了数据之后我只是一个展示只是出一个报表这个还是属于传统的这个思维模式,但是更多的要讲说我们有了这个数据之后怎么样根据这个数据重构,去重新来设计我们整个业务的流程,这样可以把数据用的更好。
在上个问题中提到数据价值,数据好的方面,也有很多坏的方面,是干扰,是噪声怎样才能通过有效方法,把噪声去除掉,把信息挖掘出来?
澳洲昆士兰大学教授周晓方表明,数据质量管理是大数据的一个问题,要从数据的完整性方面来看待这个问题。比如网上一部分人的观点不能代表整个社会,因为数据不完整。还有时效性、准确性、一致性等等问题。数据清洗这个问题已经研究了很多年。现在数据质量管理的荣耀都被AI拿走了,数据管理、数据分析、各种大数据分析都是在后面默默为AI进行支撑。如果不把这个底层的数据支持做好的话,那么就是再酷炫也都没有用。
在滴滴出行高级副总裁章文嵩看来,数据质量非常关键,如果数据不准得出的任何结论都有问题。解决的办法涉及到数据的收集、生产、传输整体的这个过程,对数据肯定是层层要做校验,哪些校验有些环节数据不准了,或者有些环节数据丢了。就拿滴滴来说最重要的一个漏洞,用户进来那个冒泡表达了他的这个目的地,冒泡之后我们有很多的动作,然后用户是个发单,平台是否派单,派单后执行最后到完单支付。这个漏斗模型其实层层环节都要校验。所以这个数据,可以帮我们定位哪些买点是对的,哪些环节是我们网络传输软件处理的BUG导致数据丢失了,这是层层校验,就跟财务做校验一样,每个环节都要校验,确保数据准确性和软件的正确性。
微软亚洲研究院副院长 首席研究员刘铁岩接触过很多传统企业,在沟通的时候更多不是讲大数据,是讲AI。在深入沟通的时候,解决第一问题是大数据问题而不是智能问题。他们的愿景是想用智能解决某个应用,实际上整个公司里的数据根本没有管理好组织起来,回到大数据真的非常重要。先是数字化,然后是传统的管理再是数字清洗。从做机器学习和AI角度来看,什么是数据清洗什么是数据管理,我们希望从最原始的数据开始出发,然后通过特别复杂的链路,连到最终应用上。每个环节可能都提供反馈信息。如果不做端到端的处理,割裂开有可能会出现什么现象?在前期做数据处理的时候以为是噪声的问题,可能是信号,我们以为是信号的东西也许是噪声。那么怎么在整个数据链路的智能化的过程中都给大家一个机会,曾经当成是噪声清洗掉的东西是有机会重新挖掘和反复匹配的,曾经被你认为是有用的东西要不断的甄别里面的宝贝在哪里,问题在哪里,这是一个补充。
我们相信,随着大数据技术的深入应用,未来紧缺的公共资源应该可能得到更加合理的分配。比如春运的火车票可以给有切实回家需求的购票者更多的购买机会,急需就医的患者可以更方便进行挂号,公众的交通也能得到有针对性的调节。大数据的明天将会令人们的生活更加美好。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。