边肖今天想起以前每次谈到马赛克技术的发展,都会留言:
我们要编码吗?明明想去掉马赛克.
害,你们这些人,别以为我不知道你们在想什么~
其实去年就给大家介绍过iPhone上的一个编码功能被破解了。
我们经常会直接在相册里编码一个重要的部分,所以会用到iOS自带的笔刷功能。
但是,一些无所不能的网民发现,如果我们将照片的曝光度和亮度最大化,编码的内容就会泄露出来。
这是因为iPhone的笔刷功能真正还原了现实中的笔刷。
如果你现在在白纸上写几个字,然后用黑色的毛笔涂抹,把白纸对着太阳,仍然可以看到涂抹的字。
有时候过多的用技术还原现实似乎也不是一件好事。
但是,细心的我发现,这种修复马赛克的方式有其局限性。
一是因为仅限于iPhone,二是因为仅限于“涂鸦”编码。
其实现在编码有很多模式。
用的最多的是小方块组成的“真马赛克”。
边肖,你最想知道的是如何移除这个马赛克。
和你一样,我也认为这项技术需要很长时间才能发明出来。
没想到,这一天真的来了。
马赛克不安全。
你不知道你在有没有朋友成?
如果是的话,大家应该都知道GitHub:全球最大的交友平台。不是,是全球最大的程序员交流平台。
每天都会有很多程来,分享他们想出的新技术和代码,并把它们开源给大家。
这个月,GitHub上一个叫Depix的项目突然火了。
没错,结合以上,你应该猜到机哥要说什么了。这个项目是:利用AI技术去除马赛克。
而且,Depix不仅仅是提供了一个思路,而是真正做出了这个技术。程不愧是的弟弟,并没有多少狠话。
罗老师说的好,不要啰嗦,先看东西。
那么,先给大家展示一下今天的Depix能做到什么。
比如这里有一段代码很厚的。
有一句话,直接扔这张图,吉哥横看竖看不到原文内容。
然而,人类做不到的,机器或许可以实现。
结果,把这张图扔进Depix,经过AI计算,会输出去除马赛克后的结果:
虽然不是特别清楚,但是基本上能看出来原来写的是什么!
如果和原图对比一下,你会对Depix的强大印象更深,它几乎把马赛克还原到了7788:
看到这里,很多人应该会害怕。
以前我们会在微信和微博上发一些马赛克。现在有了这个技术,隐私不都暴露了吗?
想想吧。最近又到了年底,很多app都推出了年度账单、年度盘点等等。
很多人喜欢截图放在朋友圈,告诉大家这一年花了多少钱,听了多少歌。凡尔赛~
但是我发现每个人都会小心翼翼的把自己的姓名地址等私人信息编码,甚至会把自己买的东西编码在账单里。
这是其中一个例子。我们需要马赛克的场合比这多。
而Depix的出现会不会让隐私不再是隐私?
在这里我可以得出一个直接的结论:至少目前来看,不用担心。
在我说为什么之前,纪哥建议大家先听我说完。Depix实现了去除马赛克的原理。
去除文本马赛克的原理
通常我们在编码东西的时候,本质上是把一张图片分成小方块,然后像Photoshop这样的修图工具会计算出每个方块的平均颜色。
然后用这个平均色覆盖整个小网格。
所谓马赛克的薄与厚,只取决于要分多少个小格子。
把马赛克恢复成原图,其实是一个逆过程。
但是你想一想就知道实现起来有多难了。
毕竟马赛克越厚,画面的细节会丢失的越多。就像上面吉哥举的例子,那些英文单词就算用Depix还原,还是很难100%还原。
所以这两天GitHub上的这个Depix项目的思路是,利用AI人工智能,让马赛克中的小方块不断匹配数据库中已有的字符组合。
这里有个问题。数据库呢?
今天拿到了代码作者提供的数据库,大概明白了他的想法。
想想看,只有26个英文字母A~Z,10个阿拉伯数字0~9,只有几个常用的英文标点符号。
看看你电脑键盘的布局就知道了。几十个键涵盖了你需要的一切英文。
这意味着在英语语法下,“字母数字标点符号”的组合是有限的。
嗯,这些组合现在都列在了Depix代码里,就在这张图片里:
Depix的作者也考虑到每个字符之间的距离,可能会影响操作,所以一次性做了一个“宽字距”和“窄字距”的数据库。
所以我们每次计算的时候,只要把需要去除马赛克的图片扔进Depix,Depix就会开始一张一张地匹配,最后得到一个大概的结果。
好吧,就这样。
,硬核的东西讲完。
机哥就要开始回答,为啥我上面说:现在还不需要担心隐私问题泄露。
目前还存在的问题
首先是,Depix 对原图的要求极高。
我看到有从事这方面的专业人士分析,这个项目目前对文本大小、字体、颜色、hsl 也许都有限制。
机哥觉得嘛,像大家现在经常用一些花里胡哨的字体,机器想要识别出来,还是有点难的。
今天本来想自己试一下,但是没成功。(这个项目是运行在 Python 语言上的,有点小复杂。)
但我看到网上有程序猿大神,已经成功运行了。
只是他说,他用自己的图丢进去 Depix,出来的结果很烂……
呐,他把他名字打上马赛克:
但 Depix 去除马赛克的结果是:
emmm,机哥仔细比对了一下,除了字母“L”被还原了,别的就还是一团乱麻。
他推测,这个项目是这个月初才做出来,目前还在初期阶段,所以还不够完善。
除此之外,我觉得对于我们使用中文的人来说,Depix 还远不能实现破解中文的马赛克。
虽然理论上中文组合也是有限的,但数量会比英文庞大得多。
So,Depix 这个项目不仅目前还不支持中文,也许在短期内也很难实现。
所以不管哪种原因,机哥上面才说 Depix 至少目前还不能对我们的隐私构成威胁。
但未来呢?
AI要看你怎么用
最近一段时间,我们似乎每天都能听见 AI 又干成什么什么事。
比如说,AI 修复了晚晴拍摄的视频,不仅从黑白影片变成彩色影片,甚至帧数、清晰度也有所提高。
还有就是前两天很火的,B 站有 up 主利用 AI 技术“复活了”历代皇帝。
让我们看到,原来历史书里的皇帝,真实的样子是这样的。
但与此同时,我也听到了有犯罪分子,利用“AI换脸”、“AI假冒声音”等新技术作案。
AI 人工智能,作为现在发展得最为迅速的技术,就像一枚硬币有两面。
有的人用它来改善我们的生活、有的人却用它犯罪。
新技术的出现与发展,是不可逆的潮流。
说到底,还是要看它怎么用呐。