互联网档案馆 Internet Archive




互联网档案馆(英语:Internet Archive)是一个非营利性的数字图书馆。成立于1996年,由Alexa创始人布鲁斯特·卡利创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费保存及获取。迄至2012年10月,其信息储量达到10PB。除此之外,该文件馆也是网络开放与自由化的倡议者之一。
其数据是由自带的网络爬虫自动搜集的,其网页文件馆「时光机」(Wayback Machine),抓取了超过1500亿的网页。
其年度预算约100万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会(Kahle-Austin Foundation)。总部位于旧金山里奇蒙德区,此地雇员只有数十人,大部份雇员工作于书籍扫描中心,在红木城也有数据中心。