我们分析了10万条泄露密码,发现了这样的套路
作者:媒体转发 时间:2019-06-28 09:02
上个月,某知名字母站的代码不幸“被开源”,同时泄露的还有部分用于测试的真实用户密码。然而在刚刚经历过铁路抢票平台470万个人信息泄露风波的人们看来,这些都不过是小风小浪。
在这个高呼“网络安全”的时代,网民却日渐没有了安全感,不管是订票出行账户还是酒店开房账户,都已经被历史证明,没有什么是不可能泄露的。
今年四月,英国国家网络安全中心与澳大利亚的网络安全专家特洛伊?亨特合作,基于数据库中存储的现实中曾经泄露出的551,509,767条密码数据集,统计出前10万条最为常用的密码公布,作为黑名单以提醒仍在使用这些密码的用户及时更换密码。
我们根据公布的10万条密码进一步分析,发现了诸多亮点。
键盘恐成最大背锅侠
人们常常用阿Q精神安慰自己一介草民,不会惊动黑客这种高智商犯罪团伙。调侃用着六位数的银行密码保护着三位数的银行存款,颇有点心累。
但是大多数人在拿到新银行卡的当天都会修改初始密码,以避免盗刷的风险。
细细想来,选个好记又不容易被猜到的密码还有点难度。
在这5亿多次密码泄露记录中,泄露次数最多的三种密码分别是“123456”“123456789”和“qwerty”,其中,最常被用作初始密码的“123456”已被泄露高达23,174,662次,堪称世界第一密码。
显然,这三种密码都呈现明显的键位特征,这在黑名单公布的10万种密码中也比较常见。
当绞劲脑汁也想不出合适的密码时,总有人放弃了抵抗,选择了最省事的方法,选取键盘中的一行连续敲了过去。
根据字母和符号作为分隔标志对密码进行分隔结果中,共出现3679次“123”字串、645次“1234”子串、331次“123456”子串和275次“12345”子串,而其他长数字串都没有出现如此高的频次。

值得一提的是,去除连续数字和相同数字的数字组合,剩下的“69”“14”“08”等数字组合也呈现出九宫格的键位特征。说明键位设置可能不同,但人的惰性总不会变。
另外,还有一些网站甚至要求必须在密码中包含符号,但大家想到最多的标点也会撞上。
最常用到的标点是“.”和“!”,分别出现600次左右。点号往往起着代替空格作为分割符的作用,而“!”则用于表达爱意的强度。
紧随其后的是“_”和“-”,分别出现229次和191次,而“$”“&”和“*”则较少出现,只有十几条常用密码片段使用它们。
密码里藏着爱
由于现代网站上常常会要求必须在密码中加入英文字母,以保证安全性,纯数字的密码已经逐渐成为上古记忆。为了凑上那几位字母,大家除了输入连续字母之外,往往会选择心里最想说出的某个词或某句话。
然而,“一千个观众心目中只有一个美猴王”在密码里也成立。
我们按照数字和符号作为分隔符,提取出英文子串,统计了最常出现的英文子串,发现频率最高的20个词中除了出现144次的“qwerty”呈现明显的键位特征之外,别的都能看出清晰的含义特征。
最常见的英文单词是“love”,将近是第二名“qwerty”的两倍。同时,带有love单词的长字段组合也有较高频次,比如“iloveyou”和变体“iloveu”分别出现81次和40次。看来能够击败人类选取密码时惰性的可能只有对某人私密的爱吧。

另一些人表达爱意的方式则更加露骨,直接将自己想说的某个词或人名作为密码。
密码中前20个英文常用词还有“angel”“football”“soccer”“myspace”“dragon”“baby”“life”和“money”等生活中常见的词,可见足球迷非常之多,此外也有一些常见的英文姓名。

在密码中最常出现的英文名是是“alex”,出现了一共116次。而日式英文名“naruto”在英文名字中显得格外瞩目,作为鸣人的英译名,可以看出这部漫画在世界范围内的影响力。
而“chris”“james”“michael”和“jordan”这些名或姓氏出现的原因,是用户为了记录自己或心爱人的名字,亦或纪念某位名人便不得而知了。
中文拼音密码也一样
由于泄露的密码主要来自西方国家网站,并没有完全显示国人密码特征,不过数读菌从这10万条密码中手动搜索了一些常用拼音,居然有意外收获。



