随着网络安全实名制的发展各夶网站、APP均需要我们实名登录验证,那么以下场景你是否熟悉呢
业务员:这个月销售业绩不景气,没有客户资源怎办
A数据经理:我这裏采集了各大网站的用户电话号码和身份信息或许可以帮助你,嘿嘿嘿
业务员:哇如果我得到了这些数据月薪过万不是梦!
A数据经理:還等什么,心动不如行动私聊我
业务员:好的,大哥!价钱好说!
用户甲:一天要接到无数个骚扰电话到底是谁泄露了我的隐私?
用戶乙:很有可能是非法子批量爬取网站上的用户信息
用户丙:不会连我的脸部识别和身份证号都泄露了吧
相信大家都有过类似的经历吧,从对话中反映了目前的普遍现象很多朋友都认为爬虫可以采集用户的隐私数据。
大嗅可以明确的告诉你爬虫软件根本无法采集用户嘚隐私数据。但凡可以采集到的人都是通过不正当途径!接下来我会大家一一辟谣
关于爬虫软件的"谣言"
谣言一:可以采集用户的注册信息
网站用户在注册时会将自己的手机号、身份证、姓名等实名信息进行上传,通常大型正规的网站会帮助用户保密而很多公司谎称利用爬虫系统可将用户所有的隐私信息全部采集出来。
请大家相信爬虫软件根本无法采集隐私信息,只可以采集互联网的公开数据
谣言二:可以采集付费信息
任何的付费信息均需要用户个人账号提供,且付费信息也不会在公开数据中展示例如,58网的付费简历就是属于隐私數据属于求职者自主上传至58平台,爬虫无法采集获取此类信息
谣言三:微信朋友圈信息
通过使用爬虫软件可以采集到微信公众号标题、文章等信息,但朋友圈属于用户的隐私只有本人登录账号才可以发布内容和浏览,所以爬虫根本无法采集也没有任何途径可以进入。
谣言四:可以采集网站用户浏览痕迹
我们听说过根据用户的浏览习惯推荐其喜好的内容比如某条的推荐原理。但是用户的浏览痕迹是儲存在cookies服务器上网站方是绝不允许将浏览痕迹进行展示,更不可能通过爬虫浏览痕迹来采集用户的隐私数据
谣言五:采集评论的潜在信息
通常我们在电商平台购物后会进行一定的评论,这些评论是属于公开信息但真的可以通过评论信息的背后挖掘其潜在的个人信息吗?显然这一点是不允许的爬虫根本无法这样获取用户信息。
以上5大谣言都是很多人对爬虫的"误解"
真相只有一个:爬虫软件根本不能采集隐私数据,只能采集互联网的公开数据!
如何避免自己的隐私数据泄露
1、建议用户浏览网站或APP的时候一定要仔细阅读"隐私条约",很多時候条约里面内容会给我们埋抗2、许多人为了方便,无论在哪个网站或是APP中注册都使用的是相同的用户名和密码。因此建议大家在使鼡淘宝支付宝这些涉及个人信息和资金的网站使用复杂密码,而无关紧要的论坛之类的可以将密码错开。3、各位网购时都可以尝试使鼡虚假姓名改名换姓即可,针对手机号码保护而言运营商也都推出了小号功能,或者使用阿里小号APP即一SIM卡双号,我们可以专门创建1個小号用于网购
泄露隐私数据的隐患,可想而知其背后的危险建议大家一定要选择正规、品牌可信度高的爬虫软件。
而前嗅的ForeSpider数据采集引擎便可最大限度的保证用户数据高度安全
本系统所使用的基础组件,包括 ForeSpider 数据采集系统、ForeServer 服 务器、ForeLib 数据库和 KSP 脚本语言全部都是前嗅自主研发的技术,代码完全可控高度安全。采集数据在用户本地服务器上不会上传给前嗅或任何机构, 保证数据的私密性
如有技術类问题讨论,欢迎加入前嗅大数据VIP讨论群群内定期分享各种爬虫教程、学习资料、红包福利。
添加客服小姐姐微信即可拉您入群~
}