世界之上
Internet Archive收录逾10PB互联网内容
>>
完整版
非盈利组织Internet Archive昨晚举行聚会,庆祝收录的互联网资料超过10拍字节(petabyte,相当于1024TB或1024X1024GB)。 自1996年成立起,Internet Archive(也叫“网站时光倒流机器”Wayback Machine)定期收录并永久保存全球网站上可以抓取的信息。
对于不同的网站,其收录的网页数量和周期也不相同,一些大型网站可能每天都会被“备份”一 次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是Internet Archive最大的价值所在。
来源:cnbeta