ZD至顶网软件频道消息:GDP和粮食价格是否有关,如果有,会是什么关系?GDP和信访投诉的关系,又是如何?这些问题看起来很有意思,肯定有人很想知道答案。但放在以前,获得这些问题的答案是一件费时费力的事情,因为这需要一个专门的团队经过一段时间的研究才能回答。不过,今天这种现状有了改变,借助大数据技术无需专家团队的介入也可以知道答案。这要得益于大数据技术的一个鲜明特点:它能很容易地发现事物之间的相关关系,而传统研究侧重于发现因果关系,这要费时费力得多。
王伟哲和他的团队在某地开展一个大数据项目时就发现,当地GDP的增幅与其粮食价格的变动直接关联;同样,GDP与信访投诉量也高度相关。王伟哲就是在为当地政府建设大数据平台时知道这些问题的答案的。从2015年开始,越来越多的政府机构开始利用大数据技术来为决策提供支持。对此,一直扎根在大数据领域的王伟哲感受非常明显。
王伟哲是北京东方金信科技有限公司的CEO。成立于2013年的东方金信,是一家随中国大数据产业快速成长起来的企业,主要提供大数据平台和大数据解决方案。根据王伟哲的计划,今年公司规模很可能达到200人的规模。政府是其主打行业市场之一。
单就政府市场来看,王伟哲说,2017年,政府对大数据的需求量会更旺盛。“因为在政府部门大数据技术有着很大的应用空间,一方面政府掌握的数据量足够大,另外政府数据足够真实。” 王伟哲在接受ZD至顶网记者采访时告诉记者。
具体而言,大数据在政府的应用主要归为三大类:大数据服务百姓(如人口与民生服务分析、人口与社区数据分析);大数据协助经济增长(如人口与资源承载);大数据协助政务畅通(政府公共服务水平评价)。
以人口统计为例,在现有体制下,公安局、统计局和发改委都可以给出自己的数据,如公安局按照户口登记信息来汇总,统计局按照抽样统计数据来推断,到底那个数据准确,其实心里并没有底,但通过大数据技术把各个门类的数据进行汇总,包括交通、房屋买卖等信息,然后分析,就能得到一个相对准确的数据,甚至要比公安局和统计局的数据更为准确。东方金信就承建过这样的项目。
东方金信是一家典型的技术驱动型公司,采用顾问式营销的方式来开展业务。在目前的团队当中,销售人员的比例不到十分之一。在分工上,销售的主要工作也只是处理合同相关的工作,与客户的沟通到项目实施大部分是由技术人员来完成的。东方金信的核心产品是基于Hadoop的分布式数据平台,公司自主研发的海盒大数据产品套件是基于分布式架构的大数据平台,该产品套件包括大数据基础平台、大数据分析平台、分布式内存系统、大屏展示工具和数据实时同步工具,涵盖了大数据产业链的数据采集、数据存储、数据管理、数据计算、数据分析挖掘以及数据应用的全部环节,可以为企业级客户提供一站式的分布式大数据解决方案。
一家成立刚刚4年的公司,能在短时间里形成一套成熟的大数据解决方案,并且得到广泛认可,一方面要归于大数据市场的成长和Hadoop的技术不断完善和成熟,另一方面则要归于公司拥有一个掌握了Hadoop核心技术的团队。根据王伟哲的说法,东方金信核心团队来自Google、阿里、 Teradata、HP、IBM等全球著名企业的核心数据开发人员,具有丰富的分布式研发能力和数据分析挖掘能力。同时,东方金信还拥有一支来自美国加州伯克利,卡内基梅隆,佛罗里达,斯坦福、清华、中科院、北大等高校10多名博士和多名硕士组成的研发团队,具备强大的持续自主研发能力。
可能正是基于上述原因,谈到技术王伟哲非常自信。他说,公司是首批通过工业和信息化部数据中心大数据能力和性能认证的六家企业之一。现在,东方金信已经用大数据技术为金融、政府、工业、健康等多个领域实施项目。王伟哲还特别强调,要确保大数据项目的实施成果,让大数据与业务的融合非常重要的。“从根本上,大数据解决的是计算的性能问题,大数据能力的发挥必须依托业务。到底大数据有多大用,要取决于业务与大数据结合的程度。”
王伟哲认为,东方金信是一家有情怀的科技公司,因为“我们非常关注大数据底层平台的开发”,“在国内,像我们这样做底层平台的,不会超过三家”。王伟哲对政府市场踌躇满志,他说,智慧型服务型政府是大势所趋,大数据在政府行业的应用非常广阔。东方金信非常愿意与业内伙伴一起联手,发挥技术优势,让更多的政府项目落地,让大数据全面地为民服务。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。