过去几年中,人工智能(AI)在金融、医疗、安保、地产、教育、商业等领域的落地受到了广泛关注。根据Gartner的报告显示,人工智能可以在未来几年中消除“数百万个中低层职位“。但它也指出,人工智能将创造出230万个额外就业机会,大大超过预测减少的工作岗位。
人工智能怎样潜移默化的接管人类的一些工作?合合信息联合创始人、启信宝CEO陈青山在2020世界人工智能大会云端峰会未来金融论坛上做了“AI+大数据,共创金融新生态”的主题演讲。并详细讲解了如何通过数字化构建一个虚拟世界,协助金融类企业建立新生态。
我们为什么选择AI
“为什么我们要采用AI数字化技术?是因为它远超人类的工作效率,甚至工作能力。”陈青山告诉记者。
合合信息是一家大数据+AI类型的科技企业。2009年创办至今,从最开始的AI感知技术,包括图像处理、模式识别、文本识别、场景识别,一直到高阶层的认知智能,包括自然语言处理、知识图谱,在这个领域深耕了十几年。
合合旗下4款C端产品名片全能王、扫描全能王和主打商务应用的启信宝和找到。累计超过10亿全球下载用户。
名片全能王,是一个在线名片分享工具。除了分享名片功能以外,使用者还可以通过关联的企业信息查询企业情况,管理企业人脉,寻找行业合作伙伴;扫描全能王,不仅仅是手机上的移动扫描仪。它可以是代替人的识别录入的机器、可以储存大量知识的“第二脑”。我们可以把日常工作和生活中遇到的文件、资料、书籍进行扫描、识别,然后生成文档、pdf,通过邮件、微信等方式分享出去,或者是存储到云端;启信宝拥有2.3亿家企业,超过1000个维度,600多亿条动态实时商业数据库。,刻画了一个全景的商业大数据世界。还有一款产品叫“找到”, 汇聚了全中国2亿以上的商业人士,服务于商业的营销拓客。
同时,合合信息基于人工智能和大数据技术协助行业,为各个行业提供STR+DATA+AI+SERVICE数字化智能化解决方案,可以渗透在业务、采购、招标、支付、财务、数据分析、数据清洗、风控、营销拓客等不同场景和业务环节,最后形成的服务将帮助企业大大提高数据录入、比对、审核等环节的效率,减少不必要的人力成本。
这些产品的背后,是AI+大数据技术的支撑。陈青山举例说明,以文本识别的准确度来说,如果是人工录入,准确率在90%;而合合平台的平台文本的机器人来做这样的录入的工作,那么它的准确率可以超过99%。比如财务工作者需要录入一张增值税发票,如果是人工来录入的话,要花上几分钟才能够录入进去,而AI录入不到1秒就能完成。
合合信息旗下产品扫描全能王, 每年所扫描识别的文档的页数,超过120亿份。如果纯人工录入需要9亿小时,而AI大概节约了45万人/年的这样一个工作量,这就是AI技术所创造的社会价值。
如何在虚拟数字世界扩张商业价值
在陈青山看来,由于人工智能、云计算、大数据这些技术的发展,以及即将到来的5G、区块链等一些技术的发展,正在不断改变包括以金融为首行业的演进。发展出来了信息金融,互联网金融,移动互联金融,甚至还有智能金融和生态金融。
AI数字化技术会将物理世界转化为虚拟世界。以金融行业为例,单据,合同,财报,图像,声音,视频,场景,都是合合的平台所要处理的AI数字化的对象。比如保险业务,大家已经很熟悉的电子保单。
中国大概有超过100家的保险公司,每个保险公司的自己的车险、寿险、财产险等。它的保单的格式,保单的内容设计都是不一样的,而且在业务流程中间,不同的业务流程,它还有不同的确认单,回单等一系列的文档是需要去存电子化、数字化甚至结构化以及做后面的一些处理业务流程处理。
所有的这些纸质的文件扫描到保险公司内部的it系统中,如果需要人工分类,是一个非常耗时耗力的工作,但是如果有了合合AI平台里文档自动分类的技术,所有这样的文件它都能够自动归类,大大超过人的工作效率。
银行业也是一样,我们熟悉的银行快速开户程序背后,也隐藏着AI人脸识别、证件识别、银行卡识别、风控等环节。人工智能可以快速帮助人们解决这些问题。合合信息把它打包成了全平台SDK,通过高清压缩图像这样一个技术,能够无损,并且所占用存储空间非常小。可以提高金融业务APP的效率,降低网络成本,降低存储成本。这样一套AI的能力的平台,银行或其他行业使用,就拥有了一套可自训练自学习的AI的训练平台,成为企业的数据资产。
陈青山举例,启信宝就是商业社会一个微缩的虚拟世界。我们会用6大维度的数据来衡量这样一家企业,每个维度都会打分,包括资本背景、经营质量、知识产权、风险情况、成长性、企业规模。6大维度之下,还有70多个细分的小维度来进一步支撑大维度的评分。有了这个评分后,企业在日常经营的决策过程中,不论是准入,还是评价合作伙伴,销售、渠道商,都能够更加容易去了解对方的信用和实力,帮助决策。
这就是虚拟世界,当数据变为信息、变为知识、变为智能之后,会产生不同的价值。如果利用数据AI的平台生成企业的尽调报告,两个小时就足够了。这就是数据治理到智能这一层的时候,所发挥出来的价值。
如果说智能芯片技术是人工智能的底层,大家都熟悉的人脸识别的技术,文字识别的技术、传感器技术,这些是属于人工智能的中层;智能机器人,智能零售、智能家居这样子的产业链,是人工智能的上层。通过启信宝也可以分析出产业链的布局,如果地方招商引资使用这些数据,可以更加精准。
无论是疫情与否,人工智能发展的进程都不会停止。根据某知名风险投资机构预测,AI将很快成为常规技术,超过50%的企业主认为,人工智能将在三年内被整合到企业应用中。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。