大数据时代下看Amazon是如何处理隐私问题的

来源:计世网  
2014/5/29 9:25:04
在访问Amazon电商网站时总会看到这样的提示,对于互联网用户来说,应该已经非常熟悉这样的推荐了吧。Amazon是通过所谓协同过滤(collaborative filtering)的技术,来实现这一商品推荐功能的。

本文关键字: 大数据 Amazon 隐私
在访问Amazon电商网站时总会看到这样的提示,对于互联网用户来说,应该已经非常熟悉这样的推荐了吧。Amazon是通过所谓协同过滤(collaborative filtering)的技术,来实现这一商品推荐功能的。
 
协同过滤是根据商品的购买记录加上网站访问记录等行为数据,对用户间爱好的相似度进行自动计算,从而实现商品推荐的。在这个过程中,商品本身的内容是无关的,而只是基于购买记录和行为记录,从某个用户与其他用户间爱好的相似度来计算出要推荐的商品,这正是这一机制的关键所在。因此,系统可能会推荐出乍看之下和用户的爱好无关的出乎意料的商品,但反过来说,这也可能会为用户带来意想不到的发现(serendipity)。
 
所谓serendipity,是指能够意外带来好运的能力,这个词是由英国小说家霍勒斯·沃波尔(Horace Walpole,1717-1797)于1754年造出来的,其辞源来自童话故事《锡兰国三王子》(The Three Princes ofSerendip,Elizabeth Jamison Hodges著)。在Web领域中,指的是用户通过搜索引擎和推荐系统发现了出乎意料的商品。
 
从结果上来说,用户将自己的购买记录和行为记录等信息交给Amazon,同时得以享受到像Serendipity这样的好处。
 
Amazon于2011年9月28日发布的平板电脑KindleFire中,提供了一项非常有意思的服务。 该平板电脑采用Android操作系统,售价只有199美元,比iPad要便宜,它上面继承了Amazon自行开发的新浏览器Amazon Silk。之所以要自行开发一款浏览器,是为了在硬件性能低于PC的移动设备上实现更快速的网页浏览。
 
为了弥补硬件性能的不足,Amazon采取了下列对策。
 
(1) 在浏览器的后台利用Amazon自己的云计算服务EC2,事先对视频、图片等数据量较大的内容进行压缩等处理,将优化后的数据传送给终端。这种方式被Amazon称为Split Browser,通过将负荷较高的处理转移到云端执行,可以比由终端直接执行实现更加快速的内容处理,还可以延长电池的续航时间。
 
(2) 基于内容浏览记录,通过机器学习找出用户的Web浏览模式,从而判断出用户接下来可能要访问的页面,并事先在云端进行缓存。通过这一机制,页面加载的时间得以大幅缩短。
 
Amazon开发的新浏览器所采用的上述机制,充分利用了该公司在云计算方面的优势,实现了Web浏览的高速化,这一点非常有意思。然而,从另一个角度来说,也有一些人认为这样做有侵犯用户隐私之嫌。
 
也就是说,用户使用Kindle Fire浏览网站时,在真正连接用户所指定的网页之前,首先要连接到Amazon的云计算服务。用户在浏览网站期间,与Amazon云服务之间的连接会被一直保持,Amazon会对用户在Web上的行为,如访问的网站URL、IP地址、MAC地址等信息进行记录,并保存最长30天。
 
根据Amazon的解释,对于这些数据的记录,是“为了解决和诊断浏览器的技术问题”,用户数据在保存和使用时不会与用户个人身份产生关联。
 
此外,用户还可以在使用云计算平台的Cloud模式和不连接到云端直接访问网页的Off-cloud 模式之间进行选择。不过,如果选择了Off-cloud模式,用户便无法享受到Silk所提供的对网页内容传输的优化、加速等好处。
 
对于由Silk浏览器所引发的隐私问题,美国国会也立即做出了反应。在Kindle Fire发布的约两周后,众议院议员、国会两党隐私权预备会议联合主席、民主党人Edward Markey,向Amazon的CEO 杰夫·贝佐斯提出了公开质询,要求对Silk的隐私问题做出解释。
 
Markey议员提出了下列4个问题,要求Amazon在3周之内做出回答。
 
(1) Amazon对Kindle Fire的用户收集了哪些信息?
 
(2) Amazon准备如何利用这些信息?Amazon是否计划将这些客户信息以出售、租赁或其他形式交给其他企业来进行利用?如果有,那么Amazon计划对哪些企业提供这些信息?
 
(3) Amazon准备采用何种方法向KindleFire以及Silk用户告知公司的隐私权政策?如果存在相应的政策,请提供适用于Kindle Fire的隐私权政策条款。
 
(4) 假设Amazon准备对用户的互联网浏览习惯相关信息进行收集,那么用户是否可以通过主动许可(Opt-in)的方式同意并加入这一数据共享计划?
 
对于Markey议员所提出的大部分问题,Amazon在其公开的“Amazon Silk使用协议”1(图表6-1)和FAQ(图表6-2)中都已经涉及到了,因此并未造成很大的混乱。不过,这一质询的确引发了人们对于为用户提供便利所必需的数据收集与隐私权两者之间关系的关注。
 
Amazon隐私权问题
 
1.隐私权信息 通过Amazon Silk收集的可识别个人身份的信息,适用Amazon.com隐私权公告,该公告内容为本协议的一部分。 Amazon Silk通过利用Amazon云计算服务来优化和加速网页内容的传输。因此,正如为您提供Web访问服务的大多数互联网服务提供商(ISP)或类似服务一样,您使用Amazon Silk所访问的网页内容会经过我们的服务器,并可能被缓存下来以提高后续页面的加载速度。
共2页: 上一页1 [2]
责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
网络安全热点透析

随着移动互联、大数据、云计算、物联网等技术的日益发展,在这些热点技术为个人生活带来便利的同时,也为企业发展..

数据安全医药行业解决方案

采用身份鉴别、访问控制、数据加密以及权限控制等多种安全防护技术手段,保障数据库中医药数据只能被合法用户合规..

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918