
互联网浩瀚无垠、无所不包,以至于我们很容易忘记它有多脆弱。
你在网上做了尴尬的事?那它很可能未经你同意就被传播,永远留在那里。但并非所有发布的内容都能永存。最近一项针对网页的大型研究发现,2013年可访问的网页中,超过三分之一现已无法打开——留下了一串“链接失效”的痕迹。
也许你觉得这是好事。如果你曾翻看自己最早的Facebook状态更新,你大概会希望那些链接早已失效。眼下正流行用AI生成《爱情岛》视频,主角是卡通水果,动辄获得数百万观看。那些穿着夏威夷衬衫的数字香蕉和调情的菠萝,有必要为后代保存吗?大概不必。
但区分哪些对我们的集体文化记忆重要、哪些不重要,正变得异常困难。试图保存一切的努力并不顺利。内容太多,且大多毫无意义。
2010年,美国国会图书馆认为Twitter是现代历史的重要来源,决定存档每一条推文。该馆写道,这“可能成为这一代留给后代的最重要遗产之一”。
这个“可能”似乎过于乐观。对大多数人而言,这个资料库既笨重又无趣。到2017年,该馆似乎也认同这一点,转而选择仅保存少量精选帖子。
选择性保存的风险,当然是可能错过重要内容。荷兰顾问莫里斯·德·昆德十多年来一直追踪搜索引擎索引的网页数量,发现已从47亿降至39.8亿。
有些删除行为比其他更为刻意。
去年,埃隆·马斯克的“政府效率部门”启动了一项计划,要削减多达20%的美国联邦网站。特定词汇如“气候变化”也随之消失。几个月后,大公司开始重写自家网站,同样删除了提及气候变化的内容。
我们之所以知道这些,仅仅因为第三方在跟踪记录——相关组织自身并未标示变更。
由于在线内容常被覆盖,历史学家艾比·史密斯·拉姆齐所称的现代记忆技术,其寿命远短于数字化前的版本。既不存在所有在线发布内容的单一记录,也没有公认的保存方式。
随着数字出版物的消亡,这一点愈发明显。你可以看到1665年(伦敦大瘟疫开始那年)印刷的报纸,但已无法访问威尔士的《国民报》这类现代新闻网站——它于2021年上线,随后被关闭。有些网站如Gawker已被存档,另一些则消失在404错误(表示服务器找不到网页的状态码)中。
少数网站进入了奇特的“后世”。当小众网站The Hairpin于2018年关闭后,其域名被塞尔维亚企业家内博伊沙·武伊诺维奇收购,他专长于购买旧新闻网站并填充AI生成的点击诱饵内容。现在,该网站只是将读者重定向到一个在线赌博网站。
尽管我们极度依赖数字数据,却将其保存工作留给了杂乱无章的个体努力。最著名的是“时光机”,由美国非营利组织互联网档案馆发起。它保存网站快照(至今已存超一万亿),但并未收录一切。版权所有者可要求移除内容,一些网站已开始屏蔽时光机,怀疑AI公司正利用它未经许可抓取内容。《尼曼实验室》报告发现,2025年下半年快照数量有所下降。
第二个热门选择是archive.today,一个使用多个域名运作的神秘网站。它能存在多久无人知晓。去年,FBI传唤了其背后的未知注册商,维基百科近期也要求编辑者停止链接至该网站,原因是“对僵尸网络、垃圾链接及网站运营方式的担忧”。
当然,线上存在的许多内容已被用于训练AI模型,这某种意义上成就了另一种“不朽”。但若你想追溯某事物的原始形态,这并无太大帮助。即便是网页的在线快照,也可能不如实体档案持久。
我们视互联网为无限且永恒的存在,但短暂性是其内在属性。如果你在网上看到值得保存的内容,最好亲自动手保存。——《金融时报》版权所有,2026年
本文由吉伊网原创发布,未经许可,不得转载!
本文链接:http://www.jkiyi.com/kj/13564.html










