AI发力：研究数百万条密码以预测下一条潜在密码内容原创

Eggheads公司已经构建起一套机器学习系统，其对人们在网络上使用的数百万条密码进行研究，进而猜测人们可能使用的其它密码内容。

至顶网软件频道消息：Eggheads公司已经构建起一套机器学习系统，其对人们在网络上使用的数百万条密码进行研究，进而猜测人们可能使用的其它密码内容。

这些AI猜测出的密码能够与现有工具配合使用，共同破解更多散列密码，并最终实现远超以往的他人系统帐户登录成功率。

在进行密码破解时，大家通常会从密码的散列版本开始，而这类数据通常窃取自数据库或者其它类似的文件。散列处理意味着密码内容已经进行单向加密，即我们无法通过解密获取原始内容。目前的工具通过猜测密码所有单词与字母可能组合（例如AAAAA、AAAAB、AAAAC等）的方式进行暴力破解，并将所有组合的哈希值同窃取到的哈希值进行比较。如果匹配，那么密码内容即被正确猜出。这种方式需要耗费大量资源，特别是在密码内容进行salt强化的情况之下。

而作为另一种优化方法，部分工具能够利用词典与常用密码词典，配合以往已经破解的密码进行哈希值转换，进而将其与窃取到的密码进行比较。

然而，如果我们能够进一步训练这类软件，从而根据人们以往的习惯预测其当前或者未来可能使用的密码，结果又会如何？

来自新泽西州史蒂文森理工学院的研究团队本月发表了一篇论文，其中详细介绍了如何利用一套由两款机器学习系统构成的PassGAN生成式对话网络达成这一目标。其中的两款机器学习系统负责相互训练，其能够将HashCat及Jack Ripper等开源工具的密码破解能力倍增，更可以立足防御角度预防密码窃取类攻击。

研究人员们利用机器学习系统对2010年泄露自音乐网站RockYou的3260万3388条明文密码进行了分析，并借此识别人们创建密码的具体规则。此后，机器学习系统即依靠相关知识尝试破解2016年领英公司不慎流出的密码散列数据。

起初，AI利用RockYou密码进行训练，并依靠相关知识成功猜测出46.85%的RockYou密码——即总计591万9936条密码中的277万4269条; 而对领英密码的猜测正确率则为11.53%，即4335万4871条中的499万6980条。如果将被正确猜出的领英密码中与RockYou训练期间见到过的相同密码内容排除在外，则正确猜测比例将降低至9.582%，即389万43条。换句话来说，这套AI方案能够以十分之一的成功率猜出其从未见过的领英密码。

这样的结果意味着，其实际表现要优于John Ripper（其能够破解6.37%的陌生领英密码（排除其已经见过的相同密码），但尚不仅HashCat——破解成功率分别为22.9%与17.67%。但如果将该神经网络软件与HashCat相结合，效果将更上一层楼，能够分别以27%与22.039%的比例成功破解泄露帐户。具体来讲，AI与HashCat这一组合能够实现五分之一与四分之一的领英散列密码破解比例。

为了实现这一切，PassGAN需要创建5亿2883万4530条新密码; HashCat会生成4万4135万7719条新密码，而John Ripper则生成5亿2883万4530条新密码。HashCat与AI结合之后，生成的密码量更是高达9亿4760万6924条。

该团队对此项工作做出如下总结：

我们的实验表明，这种方法确实具备实用价值。在利用PassGAN对两套大型密码数据集进行评估时，我们的实际效果平均达到John Ripper SpyderLab规则的2倍，而且亦可与HashCat的best64以及gen2规则一争短长——我们的结果为HashCat处理结果的2倍之内。更重要的是，当我们将PassGAN的输出结果同HashCat的输出结果相结合时，能够匹配较HashCat自身高18%到24%的密码比例。这样的结果非常可观，且意味着PassGAN能够生成当前工具所无法企及的巨大猜测密码量。

他们同时补充称，“此外，我们对于训练成效的评估显示，当拥有足够大的密码数据集时，PassGAN的成效很可能超越目前基于规则的最佳密码生成技术方案。”

换句话来说，HashCat的表现仍然相当出色。而作为早期AI成果，PassGAN目前只是一种填充空白的手段——要获得最终成功，其还需要努力全面击败HashCat。

来源：至顶网软件频道

AI
密码

0赞

好文章，需要你的鼓励

AI发力：研究数百万条密码以预测下一条潜在密码内容 原创

来源：至顶网软件频道

2017

09/21

18:44

分享

点赞

AI赋能农业：科技如何改造传统乡村世界

OpenAI计划第一季度推出全新音频生成模型

Fizz社交应用CEO谈论匿名社交为何有效

Apple Health应用的强大功能及使用技巧大揭秘

VSCO Capture新增视频拍摄功能迎接新年到来

Instagram负责人：AI内容泛滥，为真实媒体加指纹比识别虚假内容更实用

大学辍学成为初创企业创始人最抢手标签

微软如何满足客户需求：安排比尔·盖茨接见的巧妙方法

路创Aurora调光器完美解决飞利浦Hue智能灯泡最大痛点

Fizz CEO解析匿名社交如何俘获Z世代用户

教育科技创业者分享社群构建与用户留存策略

戴姆勒卡车运用图数据库技术梳理IT架构获运营红利

2025年度凌云奖揭晓，200万AI从业者共同定义“好产品”

火山引擎成为总台春晚独家AI云合作伙伴，助力打造科技春晚新体验

AI驱动企业级SSD变革：闪迪公司的创新与实践

开箱 NVIDIA DGX Spark： 把'一千万亿次'运算，“塞进”iPad mini大小的盒子里

AI“好产品”的年度答案，2025年度凌云奖即将揭晓

自研架构升级，跨越“万卡”天堑 摩尔线程在物理AI时代开启“成人礼”

智算中心进化论，科华数据如何做到“更懂”

火山引擎：AI不再只是技术潜力，Agent成为下一个战场

智能化与全球化并进，IBM中国下一个40年思考

Arm 借助融合型 AI 数据中心，重塑计算格局

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

AI发力：研究数百万条密码以预测下一条潜在密码内容原创

开箱 NVIDIA DGX Spark：把'一千万亿次'运算，“塞进”iPad mini大小的盒子里

自研架构升级，跨越“万卡”天堑摩尔线程在物理AI时代开启“成人礼”