4月28日,中国信通院“人工智能+”高质量发展研讨会在北京召开。会上,中国信通院发布“可信AI”系列评测结果。蚂蚁集团智能凭证防伪检测安全产品“蚂蚁光鉴”全项通过“可信AI-OCR服务智能化”的评估,获得最高评级(增强级)认证。
蚂蚁光鉴是蚂蚁集团自主研发的智能凭证防伪检测安全产品。该产品依托于蚂蚁十余年的AI技术积淀和专家领域经验,通过 OCR(光学字符识别)、深度学习、人脸识别等融合技术,可实现对多场景、多语种、高精度的图文凭证票据自动化检测与识别服务。检测范围包含通用文字识别、通用图片防伪、个人卡证、企业资质、经营资质、行业文档等,累计可支持识别400+项凭证类型,50+种造假手法。
面对日益严峻的Deepfake深度伪造及AIGC假证风险,该产品还将多模智能解析和多模篡改检测等技术融入防伪检测方案,持续构建业内领先的数据生成和防伪检测算法。据了解,该产品可覆盖17种AIGC生成手法和25种面部攻击类型,通过自研的大模型预训练系统进行智能化对抗训练,可大幅度提升深度生成防御检测能力。
目前,该产品已广泛应用于蚂蚁集团风控、生态、商业化场景中,在支付、互金、银行、保险、政务、医疗等领域得到大规模落地,其SaaS服务累计调用量达10亿;相关技术研究获得国内外专利18项,其Deepfake检测能力于2023年通过中国信通院深度伪造视频检测服务能力检验。
在数字化发展过程,互联网平台涌现种类繁多的凭证物料,如企业资质、外籍用户护照、购物小票等。然而,随着AIGC等技术的广泛使用,智能凭证伪造技术门槛急剧下降,黑产用极低成本即可大批量生成任何类型的假证图片,导致业务风险激增。作为将图像信息转换为文字信息的关键技术,OCR技术能在多场景下实现数据信息提取,有效提高业务效率,也能帮助机器更好理解图像和文档,推动AI在图像识别与文档处理领域中的可信化落地,得到业界广泛关注和应用。
本次测评遵循中国信通院发布的《OCR服务智能化分级技术要求和评估方法》,围绕OCR服务的功能特性、性能表现、服务稳健性及隐私安全四大核心维度展开,评估覆盖十余项关键技术指标。比如在性能上,要求即使面临弱光、侧视角、反光、模糊等复杂环境挑战,OCR系统仍需保持高度的识别准确性。蚂蚁光鉴服务均符合要求,并以高达99.45%的识别准确率获得中国信通院“增强级”服务评级认证。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。