搜狗输入法上传数据那点事
最近CSDN技术社区、人人网、多玩网、嘟嘟牛等网站都爆出被黑客暴库导致大量用户数据泄露的事件,把网际网络上弄得尘土飞扬啊。。越到年底越不平静啊。。哈哈。
前几天在技术宅社区看到一篇文章,【授权转载】密码泄漏和黑天鹅事件 ,其中一个回复表示:
很久以前觉得SogouCloud那个进程挺奇怪的,好好的一个输入法附加进程访问外置磁盘干嘛呢(从某次拔U盘开始)!一直输入密码都是敲了Ctrl+Space,但是感觉那个进程在就是不安全……
OK,对于这个,咱们来分析一下进程文件好啦。
声明:本文使用的是搜狗拼音输入法 6.7.0.0499 版本进行测试,仅代表在该软件版本下的软件行为。所以本文具备高度时效性,请读者自行鉴别。
P.S.图片看不清的话,请使用新时代浏览器(FireFox、Chrome、Opera等)进行浏览,点击图片会有大图哦~
首先,自然要分析一下这个进程调用了什么DLL文件,也就是有多少个模块。
从上图的结果可看出,在这个“可疑”的SogouCloud.exe程序运行的时候,基本都是加载Windows的系统dll,Comodo的文件是我的防火墙啦,MacType.dll是一个字体渲染软件。
只加载系统dll文件,可见其程序的功能基本是一些系统功能的扩展。
随后,大D将这个进程的内存数据进行了转储,查看了一下运行时的模块。
使用VS查看内存数据中的运行时模块
通过查看内存转储模块,与 CurrProcess检测出的模块进行对比,一致,程序进程不会因为转储调试等行为关闭一些模块和附属进程。
在技术宅社区的回复中提到,SogouCloud.exe程序会访问磁盘,尤其是外置存储设备,譬如U盘,移动硬盘等设备。
大D通过ProcessActivityView程序侦测该进程是否有访问磁盘的操作。
在开启检测程序之后,大D先后插入两次U盘,U盘里有很多的文件,文本文件、图片等数据。插入一次移动硬盘,移动硬盘内同样有大量的数据。
很遗憾,没有检测到程序访问本地磁盘的操作。
同样很遗憾,使用ProcessMonitor监视进程,同样没有发现进程访问本地磁盘,只有几次注册表操作和大量的TCP网络操作。
既然没有访问磁盘的操作,那么,这些TCP操作是在上传什么数据呢,想要知道上传的数据内容,接下来就要抓包操作了。
根据操作的内容,发现进程频繁的与IP地址为:123.126.50.7这个服务器进行数据交互操作。
下面我们使用Wireshark对与IP地址为:123.126.50.7的服务器进行数据交换的全部进程进行监听和抓包操作。
在同一时间内,有大量的收发包,我们随机对一个数据包进行分析。
抓取到3732、3787序号的数据包之后,我们分析一下TCP操作的数据包的内容。
我们分析的3732数据包有593字节,3787数据包有263字节,数据向服务器上的/web_ime/pynet.php传递数据,其中还记录有数据来源,也就是搜狗输入法的版本号。
我们可以看到,大D上次输入的“综合研”这三个字的拼音被发送到服务器上。
3787数据包则是发送的大D输入的 二零一三 这四个字的部分拼音。
数据的下方HTTP返回的代码为200,表示数据正确被服务器接收。
总结
首先,搜狗输入法的SogouCloud进程是不会访问本地磁盘资源的,使用程序监听进程磁盘操作是监听不到的,同时发送的数据包内容全部为你输入的词汇的拼音。
第二,搜狗输入法的SogouCloud进程是做什么用的。根据对上传数据行为的分析,这个进程上传用户的输入词汇,已完成对自身词库的充实。有时屏幕下角会提示最热词汇什么的,都是这个进程大量采集用户输入数据得来的。
第三,使用搜狗输入法是否会导致密码泄露,在监听SogouCloud进程时,在开启输入法,启用英文出入的状态下,没有发现进程截取用户输入的数据进行上传,可见,暂时该进程不会泄露密码。
第四,大D没有在搜狗拼音输入法的设置界面找到关于搜狗云计算服务的相关设置选项。使用AutoRuns查找,也没有发现该进程的自启动项。
第五,建议大家在输入密码时,关闭输入法并使用屏幕键盘的方式。
更新日志
不得不佩服傻X盛大糖果相册,这篇文章成文于2011年年末,当时将本文使用的图片都放到了盛大糖果相册并使用了外链。
看到一位网友在本文评论到说图挂了,这才发现本文的图片出现了问题。
经一番搜索,得知盛大糖果相册于2012年初关闭了,最神奇的就是一个国内算得上有头有脸的“大”公司,关闭一项服务时,居然没有邮件通知用户,让用户对自己的数据进行备份。
这也算上的大公司的作为?
只好今天重新做一遍,然后重新截图制作。
2013年12月7日 18:54
ORZ技術文看不懂。。。。。
現在沒用sogou了= = 在用qq拼音来着
记得q也有cloud进程的 但是刚才没找着 可能是我关了这功能?
嘿嘿。。估计QQ拼音也会有类似的功能
話說 現在只要是客戶端 都有不安全係數了
就看經營商的專業性和技術性了
不然世界即將木秘密了
呃。。话说怎么用上。。繁体中文了?
嘿嘿 折騰一段時間 指不定又折騰回去了
呵呵
现在感觉用撒都不安全,,谢谢博主提的醒,以后输入密码时一定记得关闭输入法,,,话说我直接切换可以吗?
关闭输入法就可以,直接切换也可以的时候
图敢不敢再小一点,另外抓包建议omnipeek~~
呃。。点击就是大图~~
omnipeek?没玩过……
换QQ拼音吧~
炉子牛光临俺的小站啊。。荣幸之至啊!
炉子牛大犇 我来YM
好高深的一片文章
楼主,2012了,新年快乐
太敏感了吧,为了云输入法,人家肯定要收集这些
@一堵墙
这跟敏感无关,仅仅是研究而已。
直接用comodo阻止搜狗云对键盘的监视不就可以了?
博主,图挂了,看完文章,但是没有看到图。
@cj 图补上了。