全球十大数据库
10.美国国会图书馆
尽管我们已经步入数字时代,但这仍然不能阻止美国国会图书馆登上这份排行榜。可惜的是,该图书馆并没有将馆藏内容数字化的计划(工作量之大光想想也很可怕)。
·1.3亿件馆藏品(包括书籍、图片、地图等等)
·2900万本书籍
·每天新增10,000件新藏品
·书架全长530英里(852,952.32米)
·500万数字化文档
·20TB文本资料
9.美国中央情报局(CIA)
屡屡在好莱坞电影中出现的CIA其工作就是收集和发布有关人物、地点、事件的信息,因此该机构进入这份排行榜显然毫无争议。尽管很少有人了解CIA数据库的整体大小,但可以肯定的是该机构通过外勤工作和数字入侵手段已经积聚了数量惊人的信息,无论这些信息属于公共还是私人。
·FOIA(信息自由法案,CIA的公共数据库之一)每月新增100条新内容
·有关超过250个国家和地区的详细情报
·不计其数的机密情报
8.亚马逊(Amazon)
亚马逊是全球最大的在线商店,该网站保存有其庞大活跃用户数的个人信息、收据、期待货物列表等数据,另外还在线提供超过250,000本完整文字书籍;允许用户在网站的每个页面作评论或其他互动。这令亚马逊成为了全球最大的在线交流场所。
·5900万活动用户
·超过42TB的数据
7.YouTube
我们都亲眼目睹了YouTube如何在不到两年之中从无到有成长为全球最大的在线视频库(也是最大的数据库之一,而且还在飞速扩张之中)。该网站目前每天的视频浏览量达到1亿次,每天新增65,000+新视频,这也就意味着在最近五个月之内该网站的数据库可能已经扩大了不止一倍。
·每天1亿次的视频浏览量
·每天新增65,000段新视频
·60%的视频被在线观看
·至少45TB视频数据量
6.ChoicePoint
ChoicePoint的工作是获取美国公民的信息——包括地址、电话号码、驾驶纪录、犯罪记录等等,ChoicePoint 全部囊括其中。ChoicePoint把这些数据中的大多数进行拍卖,价高者得,买家甚至包括美国政府。
ChoicePoint数据库中的电话簿包含10亿页内容,如果打印出来,其长度相当于地球到月球距离的77倍。
·250TB个人信息
·有关2.5亿人的资料
5. Sprint
Sprint是全球最大的电信公司之一,为5300万用户提供移动服务。
·数据库包含2.85万亿栏
·每天3.65亿项通话详细记录
·高峰时期每秒新增70,000项通话记录
4. Google
Google将用户提交的每次搜索都保存到数据库中,一年就能积累33万亿条数据库条目,信息量可达数百TB。另外Google还有收集用户信息的嗜好。Google通过分析用户搜索请求和用户计算机上的Google cookie为每个用户生成一份虚拟profile。
目前,Google提供的服务越来越广,涉及数字媒体(Google Video, YouTube),广告(Google Ads),email(GMail)等,Google的数据库正在以创纪录的速度扩张。就互联网数据库而言,Google是当之无愧的王者。
·每天9100万次搜索
·占据整个互联网搜索量的一半
·为无数用户生成虚拟profile
3. AT&T
和Sprint类似,AT&T是美国历史最悠久的电信公司,也拥有全球最大的数据库之一。其创造的记录包括最大的单个数据库(312TB)和单个数据库列数全球排名第二(1.9万亿列,AT&T的通话记录数据库)
·323TB信息数据量
·1.9亿通话记录
2.美国国家能源研究科学计算中心(NERSC)
全球第二大数据库当属位于加州奥克兰的美国国家能源研究科学计算中心(National Energy Research Scientific Computing Center),劳伦斯柏克莱国家实验室和美国能源部拥有并营运该机构。该机构的数据库保存有原子能研究、先进能源物理实验、早期宇宙模拟等相关数据。想要回到过去最好方式也许是开动NERSC的超级计算机来观察宇宙诞生时的大爆炸。
·2.8PB(1PB=1024TB)
·2000名计算机科学家负责运营该中心
1.世界气候数据中心(WDCC)
如果你拥有一台价值3500万欧元超级计算机你会拿来干嘛?模拟股市?搭建自己的Internet?而现实中的这台计算机用于气候研究,比如说研究大气变暖问题。拥有这台计算机的世界气候数据中心由德国马普气象学院和德国气候计算中心运营,而全球最大的数据库也在此处。
·220TB气象研究 Web数据
·110TB气象模拟数据
·6PB附加数据