谁该拥有你的社交网络数据?
CNW.com.cn
范范编译
摘要: 分布式计算(Hadoop)和大数据(Big Data)技术的一个重要应用是分析用户的社交行为,有些时候它们会在用户毫不知情的情况下进行分析。
Abstract:
Key words :
分布式计算(Hadoop)和大数据(Big Data)技术的一个重要应用是分析用户的社交行为,有些时候它们会在用户毫不知情的情况下进行分析。
大数据通常指大量不断增长的数据,包括Facebook和Twitter网站上的非结构化数据,以及从这些数据中收集信息创造商业机会的方法。然而,这一概念对于那些在互联网上展示自己生活的人来说具有风险,同时也带来了一个疑问,即到底谁该拥有这些数据?
大数据触发大竞技
大数据与Apache的Hadoop分布式计算平台等技术相关联,同时促使包括IBM在内的一些技术公司展开重量级收购。不过,GigaOm的分析师Derrick Harris指出,“大数据”的定义存在一些问题。他认为,大数据实际上是指来自不同来源的数据,包括社交网络甚至手机等来源。他说:“这些数据正源源不断地来自传感器、计算机和Web。”
Harris指出,IT和业务部门对大数据的强烈兴趣在于,能够驾驭这些数据,实际上就是能够分析这些数据。Mozilla的开发人员Christian Heilmann称,关于大数据,好消息是我们积累了大量的信息,我们拥有可利用这些数据的系统。例如,分析人类基因组信息或者提供政府数据等。通过租用一个小时的服务器使用Hadoop等技术,商业分析能够研究这些大型的数据集。
由于厂商对此越来越重视,那么他们开始采取行动以利用大数据就不足为奇了。Harris指出,IBM最近用17亿美元收购了提供数据仓库设备的Netezza公司。同时,Teradata将收购提供非结构化数据高级分析和管理的数据仓库厂商Aster Data。
大数据所有权之争
Heilmann把大数据看作是从网络上收集的任何信息,任何实时的数据。但是,谁具体拥有这个数据呢?他说:“这个问题存在很大的争议。”
“我认为Facebook等网站让用户提供他们自己的信息,却不让用户知道他们正在收集分析这些数据的行为是是很危险的。”Heilmann说。例如,用户可以上载自己喝醉的照片,而他潜在的雇主至少在此后某一时间可以浏览这个照片。Heilmann强调:“你从互联网上删除任何东西都是非常困难的。只要你把它放到网络上,它就被存储起来了。它将被复制到其他地方。你应该对于你放在网络上的东西非常慎重。”
Harris认为,这个数据的所有权取决于环境。他说:“当然是生成这个数据的公司拥有这个数据。”他指出,虽然在网络上有公共所有的数据,但是Facebook和Twitter拥有他们的用户生成的数据。例如,数据市场等大型数据概念已经导致一些公司一次用1个月时间分析Twitter的数据流。
Cloudera的CTO Awadallah认为,谁拥有非结构化数据这一问题是很难回答的。他举例称,例如苹果应用商店里的客户采购信息就属于苹果公司,虽然谷歌向用户提供删除数据的权利,但是这些数据的所有权属于谷歌。
相反,迁移社交网络数据的数据携带计划(Data Portability Project)则认为,用户拥有他们自己的数据,社交网络应该让用户方便地把自己的数据带到其他地方。该计划的共同发起人、Echo公司负责战略的副总裁Chris Saad表示,这一努力的目标是,让网站披露当用户把数据上载到网络之后,用户能够对自己的数据做些什么。
Saad同时指出,在一些案例中,用户同他们使用的在线服务共享自己数据的所有权和监护权。他说:“这就像把钱放在银行一样。虽然你拥有那些钱,但是你基本上是让银行为你保管,并可能代表你使用这些钱。”
这个问题不仅仅是隐私问题。“大数据”的定义之一就是,从多个来源中分析数据,以便找出趋势、商业机会、市场变化、潜在的客户、客户情感等许多事情。当大数据工具分析网络上的信息的时候,他们真的有权在未经拥有者许可的情况下这样做吗?
对此,Saad说:“这实际上取决于具体情况。如果你在公共互联网上发表这些信息,那么我认为社会规则就是人们期待着自己的数据被提取、分析、索引和使用。另一方面,当Facebook被视为一个私有网络,并且让你选择哪些信息可以公开时,这就有区别了,公开这些信息就违反了社会规则。”
此内容为AET网站原创,未经授权禁止转载。