听说 12306 换了个奇葩验证码,等等,已经破解了?(多图)
图片:12306如何评价 12306 的最新版验证码?
中午看到这个验证码就囧了。
以前和同学讨论过图片验证码的问题,结论就是不靠谱。
- 图片过于复杂、混淆过多、条件太诡异时会挡住大部分正常用户
- 容易被枚举,题库太弱,不如字符组合可能性多
- 破解门槛不一定高于字符型 Captcha
目测 12306 图片是低分辨率网络图片。猜想用公共服务就足够破解了,不需要自己搞机器学习什么一类。公共服务例如:
- 百度识图 百度识图——以图搜信息,发现更多可能
- Google 图片 http://images.google.com
- ...
撸代码,试运行,一次通过,放截图:
第一次:
第二次:
挂上 tesseract 识别试试(其实用过都知道官方训练数据准确率不高),来个 Good Case。
结论:
233333 ~
代码:
UPDATE: 有人提到验证问题中文字的识别。所以加入了 tesseract 试了下,Good Case 不多,需要改进。这里只是展示可行性。
转载请注明:微图摘 » 听说 12306 换了个奇葩验证码,等等,已经破解了?(多图)