如何看待官方解释北京健康宝从未采集个人位置信息,而是进行多源数据比对分析,这种实现方式可能吗?可靠吗?

使用CN2/CN2GIA顶级线路,支持Shadowsocks/V2ray科学上网,支持支付宝付款,每月仅需 5 美元
## 加入品葱精选 Telegram Channel ##

知乎用户 木头龙​​ 发表

可能,但这是在玩文字游戏。

按照我的理解,所谓的 “采集个人位置信息”,是特指手机的 GPS 定位数据。

而多部门后台联动,则是你手机连接的基站信息,可能还有来自银行的刷卡信息、电商 / 外卖的送货信息、公共交通工具的搭乘记录、甚至某些监控摄像数据等交叉比对。这些数据足以勾勒出一个人大致的运行轨迹。

这个时候,可以说个人的隐私,起码是活动位置这方面的,几乎是暴露无遗了,是否收集了手机的 GPS 定位数据有什么区别呢?

当然,特殊时期,政府采用这样的行为我认为可以理解,但更重要的是:

如何保障这些数据不外泄,被商业机构甚至不法分子利用?

知乎用户 刘海光 发表

主要是基站定位

基站定位是一种比较可靠的模糊数据。是指基站的范围是一定的,比如通过基站可以知道你在某个小区。

通过这个可以知道你是否到过某地。

当然了,通过技术手段可以实现比较准确的定位,但在健康宝里没有必要。

消费记录

比如实体店的手机付款,可以知道你在什么地方停留过。

你是否去过某个海鲜市场有比较准确的数据。因为基站定位的话,很可能你只是路过。

但是目前来看,健康宝对路过也是不放过的。

聚集记录

比如确认某个发病人的轨迹后,沿途停留的基站范围内的所有手机用户,都可以是筛查人群。

基本上来说,这种隐私数据比较模糊,针对个人来说,存在行为轨迹的隐私问题。比如可以获取到疫情期间,你去了洗头房。

目前来看,健康宝获取的数据存在时效性,所以很可能数据在超过一定期限(但肯定大于 14 天)后删除。

另外就是健康宝需要拍照验证,这个数据不排除被人利用做人脸识别的数据库。

总体来说,健康宝的机制和规范性上,比很多 app 还有基层单位处理的更好。

毕竟,你开车用的导航更精准。

可参考文献:

基于大规模手机定位数据的城市内部登革热防控模拟研究_百度学术基于移动定位的行为数据采集技术应用_百度学术

知乎用户 Cerulean​ 发表

首先对于原问题,一些关键谓语的内涵和外延是需要更加严谨地定义出来的,比如采集个人位置信息的 “采集”。

客户端请求系统的定位服务获取原始位置信息(经纬度、海拔、速度),然后通过定位服务解码获得衍生位置信息(国家、城市、街道),这个算采集个人位置信息吗?

服务端结合用户上传原始位置信息衍生位置信息,分析一段时间持久化的位置信息序列,分析一个号码归属地变动流量出口 IP 变动(运营商提供),这个算采集个人位置信息吗?

以 iOS 为例,系统提供的定位服务 Core Location 有 3 种定位模式,基站、WIFI、GPS,但是,不管是通过基站的唯一标识符、还是 WIFI 的 MAC 地址、还是直接请求 GPS,开发者和用户都不知道到底是用了哪种定位获取了位置信息,开发者只能决定使用定位的精度偏好和请求定位频率罢了,而这些位置信息请求的 API 都是需要当前的 iOS 设备接入互联网的,为了速度考虑,部分响应这些请求的服务器也是在国内的,所以…

而用户只要授权了 App 的位置服务权限,都可以在顶部的状态栏和位置服务列表查看到正在使用位置信息的 App,所以其实纠结到底有 “有没有采集个人信息” 真的意义不大。

所以题目后续的是否可行和可靠其实都没有展开讨论的必要了,因为 “采集” 这个概念的定义是不精准的。

虽然我大概知道题主是担忧位置信息的隐私泄露,但是这和目前已知的一些有类似风险且已经大规模实装的技术方案相比,实在是太小巫见大巫了,题主你知道 Cookie、ReID、和不可说吗?我们每天都授权 QQ、微信、淘宝、京东、头条、滴滴位置信息使用权限,麦克风和视频使用权限,Cookie 使用权限,有些应用还有生物识别权限(刷脸),完全没法和这个比。

如果说健康宝起码出发点是为了公共防疫,那上面的那些…

对吧?

知乎用户 1000 米恐惧症​ 发表

“不调用 gps 就不算采集位置信息”,这应该是官方的理由。

和 “不给钱就不算卖。” 有异曲同工之妙。

我有个北京的同事,没去过新发地。但有一次周末坐公交路过新发地,然后被请去检测核酸了。

gps 只是定位的功能之一,不用 gps 也能做到。

例如根据手机连接的基站也能实现不太精准的定位,虽然不太精准,但判断出一个人有没有在某个地方出现过还是可以做到的。

wifi 也有类似的能力,手机地图定位不好的时候,打开 wifi 有时候能增强定位。

蓝牙有时候也能做到,蓝牙作用距离有限,可以准确判断你有没有和感染者近距离接触过。

“多源数据对比” 这个说法应该就来源于这些。

其实我感觉调用 gps 并不是最方便的,直接用手机卡连接基站的数据一刀切就够了。

现在手机卡都是实名的,只要去过那里谁都都跑不了。

知乎用户 匿名用户 发表

这又不是反间谍任务,有基站定位足够了。

没必要从手机采集精确位置。

知乎用户 沙包妖梦 发表

健康宝本来就没有用手机终端的任何数据。。。一个 root 过的安卓手机就可以看得出来。。换句话说你拿着黑白屏诺基亚去新发地走一圈回来,健康宝照样有数据。。

他们的数据是直接从三大运营商那拿的,同时还有铁路、医疗之类各种部门的数据,肯定还包括扫码付钱的数据。这不就是 “多数据源” 吗。

所谓 “对比分析” 也没啥技术含量。。。最终就是分辨一下你到底去没去过高风险区域而已。。。

也许实际情况并没有我想象的简单,不过毕竟是大事,一旦官方认真起来都是小菜一碟

所以当然可能,而且可靠。

知乎用户 观测者 STD 发表

苹果和谷歌的方案好像是用蓝牙来跟踪你最近接触过哪些人,因为蓝牙只有离得很近才有信号。

至于保护位置隐私,这种基本上只能看信息收集者的道德修养了,间接破解位置信息的 side channel 多如牛毛,比较夸张的甚至可以从手机的电量分析出机主一天的行动轨迹。技术上除非什么信息都别收集,不然想保证位置隐私太难了。

知乎用户 朱涵俊 发表

一种方式是把北京的所有人定位信息找出来,然后再把去过新发地的找出来。

一种方式是只找出去过新发地的人,没去过去的没法知道他去过哪里。

这个主要是给下面工作人员用的,意思是工作人员只能知道你去没去过新发地,如果你没去过,他不知道你去过哪里。

另外一种就是工作人员知道你去过什么地方,比如海淀区,工作人员一看你一直在海淀区,认定你没去过新发地。

本地最近发的家电消费券,为了防止套现,要领券本人去商城刷才行。这就用到了定位。但是工作人员只需要知道你的定位跟商家的定位是否相符就行,你去消费了,他可以知道你去过商家那里。如果你没消费,定位信息也是有的,但是下面的工作人员看不到。

这个就像十几年前本地流行的查开房记录服务,一个身份证号,就可以查出所有开房记录,很多放债的,婚姻纠纷的去查。就是因为下面工作人员的权限太大,可能一个民警输入身份证就能查。而普通民警显然没必要知道一个公民的所有开房记录。以致后来就发展成产业链,提供查房服务了。

就像北京健康宝来说,工作人员只需要知道你是绿是黄还是红,没必要知道为啥红。

知乎用户 利顿红茶 发表

其实大家把健康宝想得太牛了,实际上这东西远没有那么精细。

健康宝的主要数据应该是来自于医疗系统,你去看过发热门诊是最大的一个来源。然后就是你所住小区是否有确诊,最后是你有没有到过几个重点地区,对于北京来说这个重点地区就是指的新发地。这个也不是采集你的定位信息,而是用的移动基站的数据,所以才会出现有的人只是开车经过那里,也会收到疾控中心电话,如果是收集了定位信息,这样的人是不会被判定为危险人群的。

知乎用户 VeroFess 发表

谢邀,涉密,不能说。

知乎用户 夹卡夹卡酱酱夹卡酱 发表

坐标广州,这里采集不需要定位,而是很多公共场合,有个二维码让你扫,扫了简单登记一下信息,如是进来还是出去,确定了工作人员才放行,那个二维码应该是每个地方都固定一个不一样的,这样只要你有扫过这个地方,才会被记录,不存在路过被记录的情况

知乎用户 巨蜥拉卡 发表

本来就不需要精确知道你的位置,要的是你的主要活动轨迹。哪怕只是把你最近移动支付的流水全部都拿出来,点的外卖订单拿出来,买的车票记录拿出来,你的活动轨迹都大概清楚了。

健康码无非是个粗筛,是个警告,不是石锤,红码也不会有 jc 叔叔和护士阿姨上门抓你。就算什么信息都不收集,只按你自己上报的结果和医院、社区上报的结果,按小区改颜色都可以,操作起来还简单。医院检查一个阳性是哪个小区的,然后就把社区之前普查出来的、数据库里是那个小区的全部改成红色,ok,小区名字比较特殊的话搞不好一行 like 就行了。

对外那必须是大数据啦,云啦,AI 啦,智慧啦,blahblah。为什么可以拍着胸脯说保障你的隐私?因为搞不好压根就没取过关于你的啥隐私数据(滑稽)

真正需要严格的场合,会让你直接去核酸检测,有什么码都不行的。

不要先入为主去思考定位怎么做,很多时候,当程序员就是不愿告诉你具体实现方式,非得往 algorithm 上面扯的时候,往往要么是因为代码是借鉴的他也不懂,要么是因为实现方式说出来丢人。

知乎用户 cnfan 发表

这都小问题,阿里这边直接让你授权位置,简单粗暴。

知乎用户 孙召忠 发表

听上去不太靠谱,不知道具体代表什么意思,推测只是话术,目的是安抚公众关于个人隐私担忧。

其实这事没必要搞得这么躲躲闪闪的,就大大方方的说就行了。最终的结果反正是获取到用户位置信息了,至于是采集的还是通过其他数据推算出来的,一点也不重要。

作为一个社会人,必须让渡出一部分权力。比如:肖像,我们每天经过天眼的摄像头,面部都会被拍摄并且入库分析,这就是为什么逃犯只要一在公共场所出现,立即就会被锁定的原因。

再比如:个人隐私,现在个人隐私保护有越来越泛化的趋势,比如 cookie,这玩意用来表示用户身份,在一些人看来,这也算个人隐私,“保护个人隐私” 是西方引入的一种政治正确,在访问一些外国网站的时候常常会提示:本站使用了 cookie 技术,是否允许?之类的。这是一种可笑的自欺欺人,不使用 cookie(或者替代的类似技术)无法进行身份识别,如果不用怎么知道你是 VIP 还是管理员?怎么知道你的账户余额?怎么知道你的好友??

说这么多难道我反对保护个人隐私?我的个人隐私不怕别人知道吗?我当然赞成保护个人隐私,也不想让别人知道我的隐私。

但是,接下来说到重点了,个人隐私是对人保密,而不是针对计算机系统保密,对计算机系统保密是不可能做到的。我们保护个人隐私是不让张三知道李四的信息,而计算机系统是知道李四的这些信息的,而且肯定会知道。哪个系统说他完全不知道用户隐私就是骗子无疑。

比如:某脱口秀演员的银行卡流水,绝对是隐私,我们需要严格禁止的是工作人员在未经授权就调出这些隐私给第三方,而不是让银行的数据库也不知道用户的流水,怎么可能不知道?

任何成熟的系统都会采集用户位置信息(或者其他可用于间接推测位置的信息),只要这些信息不被第三方滥用就可以了。什么是滥用呢?比如:前些年爆出的新闻,追债公司可以通过相关部门的 “内线” 实时定位某人的准确位置,这就是个人信息的滥用。

关于隐私保护话题有一个被黑的很惨的人是绕不过去的,那就是李彦宏。当年他在 “中国发展高层论坛” 中的一句话被断章取义黑了两年多。

他说:“中国用户愿用隐私换效率。”

但这真的是他的原话吗?不是!

李彦宏的原话是:“中国的消费者在隐私保护的前提下,很多时候是愿意以一定的个人数据授权使用,去换取更加便捷的服务的。”

疫情在中国的高峰已经过去,时隔两年多再回头完整的看李彦宏的这句话,没有值得吐槽的地方,历史会给这句话一个公正的评价。

一个负面的例子是英国,英国为了跟踪疫情传播耗资 1100 万英镑开发了一个联系人跟踪 APP:NHS covid-19

最初宏伟的愿景是:既能应对疫情,又保护用户隐私。政府也没有强制推广这个 APP,完全靠用户自愿,最后的现实很骨感:因为装机量少,未授予权限等原因导致接触者的检出率极低,没有任何实际意义。

最终英国政府决定放弃这一项目,转而与谷歌、苹果展开合作(与备受西方诟病的中国的做法一样)。

知乎用户 在定处 发表

没回应还好,这下做实了。

实际国际上也有很多非常重视个人隐私的国家也推出了这类二维码。但他们的作用并不是到处出示,而是为了流调溯源。即便上是采用蓝牙技术,利用蓝牙短距离通讯的特性,不记录用户任何活动轨迹,及完全保护的用户的隐私,有能实现溯源的功能。

我们现在用的这个,从名字上就有非常大的问题,所谓:“健康宝”根本没办法反应真实的健康情况。如果过不采用个人位置信息,又不是使用蓝牙,那基本上就不可能实现任何实际功能。希望能有人把这个 “信息最小化采集” 解释清楚,不然真的太可怕了。

不然,石景山万达的一幕只会增多。

知乎用户 别沉默我 发表

我想了想,还是有可能的

毕竟在北京出门

要不坐地铁,要不打车,要不坐公交

最不济也得共享单车吧

这些多少都会留有信息的

我感觉最有可能的是,手机的运营商(电信,联通,移动)有你的位置信息

你的手机只要接发了信号,运营商那可能就有你的位置信息留存了

坐火车,你刚进一个省,那个省的运营商不就给你发短信了吗。

过完年,刚回北京办出入证的时候,不也要给运营商发短信证明你 14 天没出过北京吗。

知乎用户 波澜不惊 发表

就是告诉你健康宝没收集你的位置信息,所以以前对行踪追溯困难,以后要扫码登记了,就天然不用获取位置也知道你去哪了。

至于大数据筛查去过新发地的,这意思就是这是移动联通给的数据,不是健康宝牵头搞的。

知乎用户 武林猫咪 发表

可行啊,要定位信息干嘛。

通过查询绑定的手机号对应的基站状态不就行了。

知乎用户 路人卿 发表

可能,不是很可靠。

要么真花钱了,要么骗你的。

知乎用户 jdkjskkVsjkabzgh 发表

隐私?我底裤没了 我可以说你们每个人的裸照 骚话 任何事情 都在政府眼里 国产 app 权限不给就死给你看 一给你就底裤都不剩 国产 android 定制系统更是从系统层面直接给权限 问都不问的 这个健康宝就是通过基站定位方式获得定位信息的 根本也不需要任何权限 我之前给电信投诉说知乎登陆用了天翼认证 也就是说我只要用天翼宽带或者蜂窝网 知乎能直接通过天翼于他们合作的 api 获得我的手机号码 等信息 结果铁证如山被电信高级客服恶狠狠的说我们不会与任何第三方合作 我反问那么迅雷快鸟的提速服务难道不是和你们合作?bilibili 的免流量不是和你们合作?对方直接威胁说你有本事去报警啊 然后就挂电话了!

知乎用户 hr157 发表

GPS 全球定位系统已成泛指名词 代指所有的卫星定位系统,包括但不限于 USA 的 GPS、北斗、格洛纳斯、伽利略;另外目前用的较多还是 LBS,因为成熟准确方便;

回应标题:可实现且可靠(非绝对化)

知乎用户 莫莫 发表

退一万步来说,即使是文字游戏又如何,为国为民,又不是滥用,不必较真。

仔细想想,这话可能也不是对我们说的。大部分国人真的重视隐私吗?或许早就默认了。况且这也是为了应对新冠疫情,所以对国人解不解释有这必要吗。

知乎用户 匿名用户 发表

我是很同意这种说法的。在网络上,搞过数据采集人都知道采集是一个很麻烦的事情,首先是数据量很大,再就是数据需要清洗整理,归档分析。

真正使用数据的人,直接去找源头要不就行了。打个比方,我现在要采集新浪微博的数据,那就要用到多个爬虫运用各种技术手段跟新浪微博进行对抗,然后采集下来一小部分数据。这些数据当中我还要进行处理才能使用。但是如果我直接找新浪微博调用这些数据了,他会整整齐齐非常规范的放在服务器上面一条都不漏。

现在请问聪明的你,如果政府需要你的数据,是很辛苦的采集每个人的信息,还是直接找各个公司去调用已经存在的规范信息。

你的微信记录、你的消费记录、你的扫码记录、你的快递记录全部都是规范的信息。用这个信息不香吗?

采集你的个人信息?想多了!

知乎用户 知乎用户 EY8KcP 发表

哈哈哈,微信 / 支付宝早就定位了,所以健康宝借用微信的数据也不算采集个人位置信息啊~

知乎用户 匿名用户 发表

背景:5 月 30 日后,曾使用高德地图多次路过相邻新发地的京开。

其中有带爱人一起,有走过京开辅路,也走过京开主路。

最后,大数据只采集到我一次,是我自己走京开主路,并且在收费站扫码付费的情况。其他几次还是我自己主动和社区交代的。

知乎用户 Chris 发表

没毛病,官方是说健康宝 app 本体无通过终端采集位置信息

知乎用户 匿名用户 发表

也没说多源数据不包含或采集个人位置信息啊

知乎用户 匿名用户 发表

可靠的。

GPS 是美国的,应该问一下美国有没有采集个人位置信息。

我们国家对个人信息安全是极度负责任的。

请不要把西方国家的惯用伎俩放到我们国家。

谢谢!

最简单好用的 VPS,没有之一,注册立得 100 美金
comments powered by Disqus

See Also

iOS 是不是能比安卓更能保护隐私?

知乎用户 Coa​​ 发表 老王早上搜索一下耐克鞋,很快便发现不管是抖音、知乎还是微信朋友圈,铺天盖地的都出现了运动鞋的广告。小刘发现自己的洗发水快用完了,正打算买洗发水,就发现京东的洗发水广告已经推送到了手机上。 为什么广告商总能对广告进 …

为什么闲鱼把网页版取消了?

知乎用户 匿名用户 发表 同高赞,说穿了,那么多 APP 非得出手机应用,同时拒绝出甚至降低 PC、web 端体验还不是因为手机上收集用户信息难度低得多,精度大得多,量大还难以伪造。 试想 PC 端动辄虚拟机沙箱运行,web …

急到跳楼也防不住!无需你参与,我就能转空你的银行卡!

说来也讽刺,昨天刚刚说完现在智能手机对老人太不友好,今天就是出这个事情。大家别不信!夸张?离谱?绝对不可能发生? 抱歉,这个是真的,真的不需要你任何操作,你银行卡里的钱就是我的了。不多解释,央视报道,千真万确,很多技术细节还是犯罪嫌疑人自己 …