互联网信息社会化保存的冷思考与热展望

奥鹏网院作业 · 发表于 2022-3-7 12:43:32

互联网信息社会化保存的冷思考与热展望
周文泓

摘要面向互联网信息社会化保存的研究旨在探索人类世界拓展至网络空间的信息管理实践转型策略，丰富信息管理理论与方法。文章以案例分析方法立足社交媒体信息保存实践，提取不同保存方式与具体内容，以此明确互联网信息社会化保存在资源、主体、对象、方式上面临的复杂挑战。由此，提出互联网信息社会化保存的推进策略，包括参与式管理框架下组建完备资源、主体协同机制下强化制度建设、整体关联前提下构建保存能力、复杂任务认识下部署连续性行动。

关键词互联网社交媒体社会化保存信息管理网络存档

0 引言
2019年4月19日，以新浪为首个基地的国家图书馆互联网信息战略保存项目开启围绕国家数字记忆话题的讨论，尤其是把新浪微博2，000多亿公开博文与相应的5，000亿评论互动纳入其中，引发热搜热议。这意味着网络归档在我国从分散的局部实践走向建设覆盖全国的分级分布式中文互联网信息资源采集、保存与服务体系的新阶段，有利于记录多主体多时空的文明脉络，更助力国家信息安全与社会信息化建设。其中，项目提出的社会化保存彰显了我国信息管理主体从国家战略层提出的宏大命题，它面向不同网络层、服务平台、应用工具、信息形成传输与利用主体等，但同时从内容、形式、背景等方面呈现社会、文化、技术、司法、管理挑战。识别其中的重点难点并探索出相应对策是互联网信息保存项目得以连续的要义所在，限于互联网包含众多门类，而社交媒体作为代表性的网络应用，亦是此项目的首个试点基地，从其入手有助于一窥全景。

社交媒体保存档实践早已显示互联网信息社会化保存绝非一蹴而就的命题。政务社交媒体信息的档案化管理通过近10 年的实践，在美国、澳大利亚、英国等形成政务社交媒体文件全流程管理以及与之相应的档案库；同国家图书馆互联网信息战略保存项目性质类似的涵盖范围更广的社交媒体保存2010年已体现于美国国会图书馆Twitter 档案项目中；其他实践均体现出各国与地区多元主体的参与和协作。然而，具体进展频频陷入瓶颈，法规政策、收集方案、长久保存策略、技术工具、利益机制等均存难解之题。在展望通过互联网信息社会化保存拓展数字记忆建构的同时亦需考虑到互联网记忆稍纵即逝的风险。

理论层面，社交媒体保存已不是档案领域新论题，国内外一系列研究对社交媒体信息保存的必要性、挑战、模式、优化策略等展开探索。首先，社交媒体信息保存的必要性获认可，证据、信息、资产、资源、记忆等多维度价值得到明晰[1]；其次，围绕社交媒体信息的背景、形式与内容特征基于已有实践分析保存对象特点以及相应的管理挑战，如制度不充分、信息量大、多形成主体、技术环境复杂等得到明确[2-3]；再次，机制、技术、政策等方面的对策都在研究中有所提及，多元主体参与的社会化模式得到倡导，提倡建立政府机构、记忆机构以及社交媒体平台的协作机制[4]；最后，探讨了组织架构、制度规范、技术工具等具体支撑，各方面策略得以提出，如建立社会化记忆机构联盟、优化归档政策、API或爬虫工具的开发[5-6]。然而，在研究成果凸显社会化这一要义的同时，这些研究偏重于社交媒体信息保存的必要性、价值、方向以及宏观模式，对于如何实现社交媒体信息社会化保存的具体问题与策略则缺乏充分设计和说明。

本文立足于社交媒体信息存档的代表性实践，解析其共同呈现出的问题以明确社交媒体信息所显示的互联网信息社会化保存的复杂性，然后基于对策的角度设计应对策略并展望保存成效。

1 多元社交媒体信息存档实践概览
1.1 外包式的政务社交媒体信息管理
由于信息形成于独立于政府之外的商业平台，政务社交媒体信息的档案化管理体现出对社会力量的依赖，正逐步实现不同层面的社会化参与，尤其表现为衔接自商业性文件中心的外包特色。目前的实践主要体现为：

(1)平台契约类。即由政务社交媒体信息形成主体，在政策法规、档案机构规章制度、机构内部管理规范的合规框架内，同社交媒体平台达成平台使用协议，对信息实现全流程管理。社交媒体信息形成主体以合约方式将信息管理一定程度上免费外包于平台。美国与澳大利亚从联邦到多个地方州均有采用这类管理模式[7-8]。以美国联邦政府机构为例，随着总统换届，奥巴马2008年竞选后在社交媒体平台形成的白宫Twitter信息、视频记录等社交媒体信息，依据《联邦文件法》与相关法规，应被及时移交、处置与保存，由此启动针对奥巴马及其团队的社交媒体档案项目。依据NARA《公告2014-02》，一旦联邦机构在社交媒体上的信息被识别为联邦文件，联邦机构需按照《联邦文件法》等规定捕获、管理、保存、利用好这些文件。在美国总统预算办公室的推动下、国家档案与文件署的专业指导下、各社交媒体平台依据协议以及法律法规的配合下，社交媒体信息得以在线捕获和移交保存。以Twitter为例，在Twitter的技术和开放接口支持下，奥巴马的@POTUS账户在2017年1月20日由第45任总统启用的同时，奥巴马总统原有的Twitter信息一方面线上迁移至由NARA维护的新创立账户@POTUS44，同时在线下保存至国家档案馆[9]。

(2)商业托管类。即在当前文件管理系统和网络归档专业能力有限的情况下有偿使用第三方商业机构的服务，由第三方商业机构根据文件档案管理相关法律法规以及机构的特定需求开展服务。目前Archive Social、Archive it等机构均对各国与地区的政府提供定制化服务[10]。以美国联邦与地方政府较常使用的Archive Social 为例，它是政府社交媒体文件托管公司，有超过1，800个政府机构客户。它能做到严谨的合规性，遵从联邦层面的《信息自由法》《总统文件法案》等以及每个州的法律法规，在文件必要捕获、优质维护、提供利用如信息公开、回应公众请求等方面均有相应产品。Archive Social能全天24小时自动持续捕获Twitter、Facebook等8类社交媒体平台信息，不同配置中形成的原始格式信息及其相应元数据均能得以捕获，从捕获到保存都能实现其真实、完整、安全、可用；还能面向利用整合信息，以多元方式如关键词、日期、内容、标签等组织所捕获信息。同时，Archive Social还提供个性化服务，信息的鉴定、审核、保存、处置等均能根据各机构的规则设置[11]。

1.2 协同式的社交媒体信息资源库建设
对应于由形成者分散式地对社交媒体信息进行前期独立的档案化管理，由记忆机构如档案馆、图书馆集中统筹建成长久的资源库亦是较为普及的模式，这有赖多方支持：平台的配合，保证开放技术接口与捕获前、捕获时的质量；第三方机构的工具、技术支持；信息形成者，确认和许可捕获范围与处置方案。较典型的案例为：

(1)档案馆主导的社交媒体信息资源库。英国、加拿大的档案机构均有相关实践[12]。以英国国家档案馆为例，其依据《公共文件法》在2013年正式收集中央政府Twitter或YouTube账户发布的内容。英国国家档案馆统筹整个项目规则制定和落实，是信息资源最终的保存者和提供利用者；MirrorWeb公司有偿提供技术服务，按照一定频次爬取和捕获相应社交媒体上的内容；英国中央政府各部门按照法律，许可其所发布的内容被捕获，且提供应有支持，例如社交媒体上存在无法网页爬取的内容时，该部门应主动报告部门文件管理官和国家档案馆，以评估是否应以其他方法保存，从而确保归档的完整性；社会组织——互联网记忆基金会对该归档项目提供资金支持[13]。

(2)图书馆主导的社交媒体信息资源库。美国、中国、荷兰均有相应实践，规模上更具代表性的则是美国与中国[14]。美国国会图书馆的Twitter档案项目，2010年4月，美国国会图书馆与Twitter签订协议，协议规定Twitter公司将为国会图书馆提供公司从成立开始的tweets文本。项目主要开展如下方面的工作：①接收数据。2010年Twitter指定名为Gnip的公司来完成数据移交事务，之后国会图书馆和Gnip 在移交“现行”tweets 的具体要求和流程上达成共识，移交工作于2011年开始。②建立稳定与持续的Twitter 档案馆，这是指形成稳定和可持续的方式获取、保存与组织Twitter不断增长的信息流。③探索实现Twitter收藏利用的方法，Twitter信息在数量、增速、内容和形式等方面都对管理与技术提出了挑战，如何将这些海量信息整合成可供方便利用的资源需要研究[10]。项目把Twitter的收集对象主要分为3个阶段：①对2006-2010年12月的Twitter文本进行全部收集，这是签订合约时明确规定的；②以更加同步的时间接收Twitter 在2011 年之后形成的全部文本类信息；③2017年12月31日起，基于国会图书馆的收集政策有选择地收集Twitter信息，形式上不再仅限于文本，而是包括视频、图片、音频、链接等其他形式[15]。

中国国家图书馆“互联网信息战略保存项目”尚处于启动期，在实践数据上显示有限。经由网络调研所收集的国家图书馆与新浪网对外公布的信息，项目亦有较充分的内容：根据双方在2019年4月19日签署的合作协议，为实现对网络时代社会记忆、人类文明的协同保存，中国国家图书馆将会统筹建设覆盖全国的分级分布式中文互联网信息资源采集与保存体系，并提供信息数据保存规范、遴选机制、服务需求及利用需求；新浪将会全力发挥自身技术优势与平台优势，与中国国家图书馆加强数据对接，提供信息数据采集、保存、检索、提取和挖掘等方面的技术支持；此外，国内其他互联网企业和机构都可申请参与该战略保存基地的共建中。在新浪微博上形成信息的各类主体所有已经公开发布的博文，都将被该战略保存基地采集和保存。据新浪统计，截至2018年12月，微博全站公开发布博文超过2，000 亿条，图片和视频量超过500 亿条，评论互动总量近5，000亿，且新发布的内容也会持续被保存[16]。

1.3 共筑式的服务型社交媒体信息保存
同互联网的高度自组织特点相关，网络归档主体亦有大量的非政府组织与个人，其依赖社会赞助与各类专家获得持续运营的资源提供两类服务：以第三方的名义捕获各类社交媒体信息且提供信息利用服务；在为机构与个人自主收集提供工具的同时将这些机构与个人转换为公共资源贡献方。全球最大的互联网档案馆Internet archive和Andrew W.Mellon基金会资助的由美国马里兰大学、弗吉尼亚大学、Shift Design公司合作创建的DocNow项目是其中两个代表性实践[17]。

以Internet Archive 为例，作为全球最大的网络信息保存服务型平台，它的运营支持来自自身提供服务的收入、基金会和公众捐赠。它所保存的社交媒体信息主要来自4方面。(1)Internet Archive每隔一段时间通过网页快照存档许可被抓取的信息，其中包括部分社交媒体网页，部分以专题整合为“档案集”，如“占领华尔街Flickr照片档案集”存有15，103 张在Flickr 社交平台上公开发布的照片。(2)Internet Archive 增值服务工具Archive it 帮助各类用户依照需求捕获、维护和利用自身的社交媒体信息，可共享至Internet Archive，截至目前Archive it已经为16个国家共694个组织服务，社交媒体信息是归档信息中的重要组成部分。(3)社交媒体平台自主提供合作资源，如YouTube就贡献了部分视频；(4)公众个人通过Archive-it和Wayback Machine保存自己或者他人的当时的社交媒体信息，还可上传自己已有的数字资源到“档案集”中，如在美国国会图书馆的个人存档项目中得到推荐使用。在技术开发过程中，图书馆提供了协助，如北欧五国图书馆同其合作研发信息采集软件Heritrix[10，18]。公众作为用户利用其所保存资源的同时可通过打分、信息补充等方式完善资源，且可申请删除已捕获信息维护自身权益以及帮助平台减少伦理与法理风险。

2 冷思考：存档实践映射的社会化保存多重挑战
纵观国内外现有的社交媒体信息保存实践，均处于不完备的状态中。政务社交媒体文件迟迟未有完整的政策规范明确其捕获、鉴定、分类、长期保存的要求；社交媒体信息保存法律与标准尚未面向长期保存与即时处置的平衡予以制定；已经得到捕获的信息未能被有效整合与提供利用；社交媒体平台与第三方保存机构提供的只是暂存以及有限的保存功能，信息质量维护力度不足。这很大程度在于社交媒体信息存档是复杂的系统性事务，更突显出互联网信息社会化保存需关注的多方挑战。

2.1 庞杂的保存资源需求
社会化保存需应对跨平台、跨主体、跨时空的复杂信息，社交媒体仅受其传播特性、用户基数大、覆盖领域广泛、形式多样以及平台多元的影响都形成了大量复杂内容与多种形式的信息。因而，就某个平台的社交媒体信息而言，若要面向社会化保存匹配多元需求的信息：一方面，需大量齐全和动态升级的软硬件基础设施，包括存储与运行设备、管理系统、网络配置等，这要求大量的管理资源与经费投入。另一方面，社会化保存的整体规划、统筹和落实，需要不同层级人员，如高级主管和基层人员以及有着各类业务专长(包括信息、技术、法务、人文、管理等领域)的人才组成的团队，由此满足整体项目的运行和保存这一专业事项从收集到提供利用的全流程要求。因而，社交媒体信息，尤其是在以构筑整体网络资源为目标的情况下，绝非某类机构可提供完整的保存资源。以美国国会图书馆为例，其项目公告中提及的一个重要挑战就是难以配备充足的基础设施，依据其自我评估，完成一个检索任务需要24个小时才能完成，除非能投入成千上万台服务器[15]。更需说明的是，对我国而言，当前仅是新浪一个平台，首期要收集的新浪微博在2018年12月前就包括2，000多亿公开博文与5，000亿评论互动，之后还将随着3亿多用户对平台的持续使用不断扩充[16]。而微信、百度贴吧、豆瓣、知乎等社交媒体平台尚未纳入，且其他类型的互联网应用更不在其中。相比此后将随着互联网信息保存项目拓展的其他平台，这仅是一小部分，所需资源更要通盘考虑和计算。

2.2 信息边界难分的主体矛盾
社交媒体被视作由多元主体共同生产与消费机制支撑的平台，其信息的形成者、传播者、利用者相互转换和融合。一方面，内容生产者与消费者互通互换，并同提供网络服务的平台形成多边信息消费场景，平台用户通过平台获取信息的同时也贡献信息于整体的资源建设。另一方面，不同主体形成的信息需融合才能组成某个主题或活动的完整记录。例如，用户发布的信息之下往往有其他用户的评论、转发和点赞信息，更依赖于平台为信息提供的半结构化形式配置。因而，在保证完整性立足关联收集和提供利用信息的同时，社会化保存中不同主体之间的价值取向和利益冲突是需要克服的挑战。一方面，形成者、保存者和利用者的立场与要求不同，信息权属与隐私需界定和保障。已有实践将用户发布的公开信息纳入保存的潜在范畴，那么法理上将个人或私人机构所形成信息捕获至公共机构并提供利用是否侵犯其信息资产，且一旦提供利用是否会违反形成者的意愿或造成伦理风险，形成者为现行活动创建与公开信息是否就意味着允许面向未来的长久开放利用？另一方面，平衡共同形成者机制下不同形成者的权益与取向需从伦理上明晰人与信息的利益边界，更要从法理层确定形成者与信息的权属规则。例如，美国联邦政府捕获社交媒体信息时明确为保障13周岁以下儿童权益不公开与收集其评论[19]；英国国家档案馆和美国国会图书馆认为提供利用网络信息的挑战是如何识别和处置已收集但在平台端被用户删除的信息[20]。

2.3 难以保存社交媒体作为信息库的整体关联
社交媒体信息保存是对信息内容、背景、形式、有机联系等要素的整体行动，它从整体到微观都是以叠加和关联形态呈现。微观层，即使一条记录，也有很大可能围绕某个主体、某类事件同其他信息产生关系。宏观层面，社会组织、机构、群体以及个人在社交媒体平台开展社会活动开展信息行为时也依托社会网络产生互动，因而围绕主体或活动产生整个社会的关联，这也是互联网信息保存项目被视作构建国家数字记忆的缘由所在。社交媒体平台要作为整体关联的资源库得以持续运行且纳入保存项目也需维护此特质，以帮助最大程度还原社交媒体信息所记录下的多元场景、主体、活动以及相互之间的关联。然而，上文所述关联往往隐性嵌入信息对象及其元数据中。一方面，在捕获的前端就需收集平台主要信息关联机制及其要素，如主体类型、社交网络、内容、时间、地点、活动，明确有哪些关联且能够与应当先捕获哪些关联；另一方面，面向利用的整合过程中进一步补全与提炼关联，通过技术与人工分析共同将其完整显性化，从而将充斥碎片化信息的社交媒体信息库转化为有序化资源体系。然而，这些关联的数量、类型、向度与深度的复杂使得难以被直接捕获与整合，要求制定与动态升级相应规则与技术方案。例如，Internet Archive 只能依据平台或时间提供检索结果，未能充分展示某个主体或某个事件的全貌，这在于信息之间的关联在捕获与整合时暂时难以整体构建[18]。

2.4 多元保存方式的冲突
社会化保存意味着不同保存力量的参与，它被视作由大众书写国家记忆的重要途径。各类协作式实践显示多元力量参与的必然趋势，社交媒体网络服务提供商、形成者、记忆机构、第三方社会机构等涉及其中，但不同保存方存在立场、目标、意识、能力、方法、资源的差异，协作是对各方记忆与遗忘的平衡，即使是同样作为记忆机构的图书馆和档案馆，都有不同之处。在这其中，保存什么、谁来保存、如何保存、保存的信息如何利用等都需要统筹与设计。当下实践中挑战源于各方参与的过程缺乏协同或统一的框架。以Facebook 为例，保存由3 条主线组成：一是由平台自主保存，采用了冷保存与共享式开发的策略；二是为用户提供“档案管理”功能，为形成的不同类别信息配备信息下载功能[21]；三是Internet Archive会抓取部分网页，Facebook已是其每年捕获数量最多的15个网站之一。然而，三方各自展开保存行动，并未协同甚至形成了冲突。前二者同Internet Archive 基本相互独立，没有在方法、资源与平台上协作，而Facebook同用户作为保存者的矛盾更甚，引起平台信任危机，最典型的是Facebook向社会开放部分信息供开发使用，导致技术公司剑桥分析通过10多万用户信息关联捕获到8，000多万相关用户的信息用于美国总统竞选，引发关于信息权和隐私的恐慌[22]。以英国国家档案馆的社交媒体档案库为例，在为2012年伦敦奥运会展开专项行动的过程中，由于Facebook没有开放接口导致整个项目缺失了存有大量奥运会信息的记录[5]。

3 热展望：面向信息管理理论、方法、能力升级的社会化保存策略建构
由多主体形成的涵盖社会多方面甚至跨平台的全方位社交媒体信息向图书馆、档案馆、博物馆、信息部门等提出多重复杂挑战，在以“全体”保存数字记忆的目标下，面临权益与义务、法理与伦理、技术应用与开发等有待周全的事宜，互联网信息社会化保存项目作为分支分阶段项目的集成群将迎来更复杂的挑战。同时，当前实践困境亦为制定对策提供方向，更是为记忆与信息机构在数字转型中立足网络空间升级理论、方法、实践能力显示空间。

3.1 参与式管理框架下组建完备资源
为匹配信息保存所需的软硬件、文化、智力、财力等资源，社会化协同是必要途径，即多元主体参与信息保存，依据各主体的特质相应定位，为不同方面的贡献提供协同机制。当前，我国基本形成了以图书馆、档案馆等记忆机构领衔的互联网信息保存机制，立法机构、政府、网络服务提供商、个人与机构形成者、第三方服务机构都有参与空间。

(1)信息与记忆机构成为关键辅助者。在国家图书馆作为领导机构的当下，还应纳入其他图书馆、档案馆、博物馆、信息部门等信息与记忆机构形成记忆联盟，以形成更加充分的资源推动互联网信息保存项目的开展。不仅要做保存者，而且要通过全局性的顶层设计和行动计划做统筹者、主动的收集者与指导员。

(2)形成者尤其是大众是绝对参与主体，如果实现人人参与，那么人人都成为信息的记录者、搬运工与管控人，他们不仅是信息的利用者或有限的参与者，而是成为一定程度或情境中的主导者，以众包等形式分解复杂任务。

(3)立法与政府机构，可通过网络空间的法律法规与规章制度来确定信息保存与处置要求，明确信息与数据权属，确认有哪些利益相关者及其相应的权利与义务，由此帮助互联网信息保存项目确认法理与伦理规则。

(4)网络服务提供商作为信息的形成、传播、存储与暂时性保存平台，应在管理与技术上配合互联网信息保存项目，既要保证信息真实、完整、安全、可用等可信属性，亦要依据权属完成信息的迁移、保存以及提供利用。

(5)第三方记忆机构，可为互联网信息保存项目提供资源与技术支持，如可同Internet archive交流合作使用相关技术实现对信息的捕获、整合以及提供利用。

3.2 主体协同机制下强化制度建设
为保障多元主体参与，多层级多类型的制度帮助明确利益机制与规则是要务。当前我国围绕网络空间信息形成《中华人民共和国网络安全法》《互联网个人信息安全保护指南》《全国人民代表大会常务委员会关于加强网络信息保护的决定》《互联网信息内容管理行政执法程序规定》GB/T 35273-2017《信息安全技术个人信息安全规范》《微博客信息服务管理规定》《即时通信工具公众信息服务发展管理暂行规定》等政策法规。基于现有制度，两大方面的补足是当下互联网信息保存项目可获得实质性持续推进的重中之重。

一方面，政策法规的内容覆盖面应持续拓展。首先，信息管理流程上应从形成与传播层面拓展至更加全面深入的保存段，当前政策法规主要是规范信息与传播环节，但信息形成与传播之后的捕获、迁移、处置、维护、保存等一系列跟保存相关的事宜除了在安全维护上有一定涉及外基本无相关内容，这是政策法规应拓展的部分。其次，从个人信息扩充至体量更大的内容信息，即用户开展社会活动在社交媒体所形成的各类记录，内容信息的价值是作为用户证据、记忆、资产、资源所必要管理的一方面，而内容信息的失真失存失当利用给利益相关者带来的损失亦是内容信息保存应得到规范的原因。最后，社交媒体信息保存利益相关者应当在政策法规层面得到确认，即保存相关方如记忆机构、形成者、第三方机构、网络服务提供商等应予以识别并从权利与义务上明晰边界与具体内容。

另一方面，以政策法规为中间层进行层级拓展。首先，在顶层设计上实现国家级的战略导引与部署，国家数字记忆的提法呈现了一定的顶层战略性，但互联网信息的证据、资产、资源价值应当同样体现，并同网络空间治理、安全以及网络命运共同体等进一步关联，且与人工智能、智慧城市等规划连接，由此从国家层面倡导互联网信息的社会化保存，并实现阶段性目标设置与具体规划。其次，丰富规范与指南制定，帮助不同主体在有意识参与的前提下明确可以提供何种贡献以及如何行动以贡献于互联网信息的社会化保存，从目标、原则、方法、流程、保障等多方面明晰具体要求。最后，增加不同主体围绕互联网信息保存的协议建设。例如，平台提供的服务协议要加强信息保存的内容且要符合专业管理要求，而机构形成者更要同社交媒体平台达成合约确定信息归属，社交媒体平台、用户、记忆机构亦要通过协议确认保存以及利用社交媒体信息的权责等，由此能够将不同主体的保存需求与所能提供的贡献精准融合于协同机制中以落实到具体实践层，从而确保互联网信息保存项目有“契约”依据。

3.3 整体关联前提下构建保存能力
依据我国网络归档现状以及互联网信息保存项目的基本路径，保存能力在整体关联的前提下表现为：一方面，在能力建设上显示为互联网信息保存各利益相关者的识别、关联与协作，这包括信息的形成者与传播者、提供服务的互联网平台、具有专业能力的信息与记忆机构、有意参与的具有资源的第三方社会机构等。互联网信息保存绝非一方可独立完成的任务，他们既要形成面向整体的多元协作主体群，亦要明确信息与记忆机构在专业前沿和使命担当上的示范性。另一方面，这些主体要共同构建出的能力在内容上表现为兼具信息管理、技术应用、人文素养的系统整体。信息管理是互联网信息社会化保存的核心，即保存哪些信息、具体流程与环节、相应规范和标准等都在互联网文化与技术情境中得到细化与建构，以此解决如何做的问题；技术应用是强化实践技能，将互联网信息保存如何做的问题通过开发和应用各类技术予以辅助乃至落实；人文素养则是帮助明确互联网信息保存的方向，在协作中明晰相互边界，在信息内容与信息管理分工上协调好法理和伦理冲突。具体能力建设将分成通用与专业能力建设两大层面。

(1)作为形成协同的主体群，文化培育与素养建构是重点。文化培育上，要确保各主体参与信息保存且发挥主观能动性以落实于合规有效的行动，这为互联网信息保存项目提供认识基础。一方面，信息文化应得到贯彻，即在国家层面完成自上而下的信息作为证据、记忆、资产、资源的认知构建，推动各类主体将信息保存作为必要的社会活动进行开展。另一方面，参与文化需得以培育，即各主体能认识到互联网信息保存是社会共建的事务，不仅能够主动参与，而且能知道在协同框架内各有分工，积极和有效的参与是重点。素养建构是信息保存从意识落实于有效行动的关键，即各主体能够理解信息保存的内涵、要求、自身定位以及实践要领，这就更加要求图书馆等信息与记忆机构作为推动者组织形成互联网信息保存框架，包括满足不同需求的法律、政策、标准、原则与方案等。

(2)作为互联网信息保存项目的领导者，国家图书馆及其组织的记忆联盟更应加强能力建设。两大方面尤其要得到强化：一方面，信息保存专业能力。当前信息管理理论与方法已不完全适用于互联网信息的整体关联保存。可针对不同应用如社交媒体试点多元方案，根据互联网信息的特质、保存目标、保存要求等形成相适应的模式，由此需要的是在专业能力上重构信息管理理论与方法，并完成流程再造。另一方面，技术应用与开发能力。互联网信息保存依赖于技术支持，能够识别技术需求并应用合适技术是信息与记忆机构不可或缺的能力，同时能够将技术使用于互联网信息保存的具体场景中，且必要时面向专业需求完成部分技术的自主升级甚至开发。

3.4 复杂任务认识下部署连续性行动
互联网信息保存不是一蹴而就的命题，更非即时完成的任务，只有这样的理解，才能将目标与规划精准融合。因而，认识与行动都要有相应策略。

(1)理解互联网信息保存是复杂任务的内涵。它的复杂性在于：一方面，互联网信息保存是跨网络场景与应用的，即面向不同功能的网络平台以及利用主体，其信息背景、内容与形式均各有特点，实现全体或大部分保存是极为艰巨的任务。例如，即使是新浪微博这一单独的社交媒体信息保存已呈现各种挑战，而新浪微博只是众多平台的一个，充分的资源与能力有待长久的建构。另一方面，互联网处于“生长”中，它并非固化于当下的形态，而是随着社会与技术发展而变换，其形成的信息随之在背景、内容、形式上发生变化，保存要求亦需要调整保存理论、方法与具体方案，这将随着互联网的发展而持续。

(2)有效规划是应对关键。互联网信息保存作为复杂任务绝非一个时间段与一个方案可简单完成，而是需要精密部署形成有效规划：一方面，确认保存目标以明晰方向、原则与方法，从而依据时空设定保存范围与行动阶段。例如，总体目标是哪类信息的保存、项目分为几期、平台选择标准等都应纳入顶层设计中。另一方面，面向未来的具体行动规划亦是必要，即确认清楚每一阶段的策略、维度与实施路径。例如，在无法周全所有平台的情况下可选定重点的网络应用类型与相应的代表性平台。

4 结语
互联网信息社会化保存已是数字转型背景下社会记忆建构的重要方面，是人类记忆由国家书写走向社会书写的关键方面，在当前社交媒体从官方组织、社会机构、群体以及个人相互协作又各有主导的多元实践中呈现了探索进程、挑战与发展方向。本文基于社交媒体存档实践从资源、主体、对象、方式等维度显示了互联网信息保存的复杂性，对应提出组建完备资源、强化制度建设、构建保存能力、部署连续性行动的具体策略。同时，限于互联网信息社会化保存涉及信息、管理、司法、人文、技术等多方面的复杂性，既要求理论上深化跨学科的升级阐释，又要求更多实践数据的收集分析，有待更全面深入的研究。

参考文献

[1]万凯莉.美国Twitter存档项目对我国社交媒体信息档案化的启示[J].浙江档案，2014 （5）：8-11.

[2]Wiley J.The Onslaught of Big Data and the Information Governance Imperative Information governance for socialmedia[M]// Robert F.Smallwood.Information Governance： Concepts， Strategies， and Best Practices.New York City：Wiley，2014：1-22.

[3]Bushey J.Convergence，connectivity，ephemeraland performed：new characteristics of digital photographs[J].Archives&Manuscripts，2014，42（1）：33-47.

[4]宋香蕾.政务微博档案化模式研究[J].档案学研究，2017（1）：51-56.

[5]Helen Hockx-Yu.Archiving Social Media in the Context of Non-print Legal Deposit[EB / OL].（2013-07-30） [2019-08-18].http：//library.ifla.org/999/.

[6]高晨翔，黄新荣.我国社交媒体文件的档案化政策研究[J].图书馆研究，2017（7）：47-55.

[7]NARA.Bulletin 2014-12：Guidance on Managing Social Media[EB/OL].（2013-10-25） [2019-08-18].http：//www.archives.gov / records-mgmt /bulletins/2014/2014-02.html.

[8]NAA.Your social media policy-what about records?[EB/OL].[2019-08-18].http：//www.naa.gov.au/information-management / managing-informationand-records/types-information/social-media/index.aspx.

[9]The White house.New Lenses on the First Social Media Presidency[EB/OL].（2017-01-05） [2019-08-18].https：//obamawhitehouse.archives.gov /blog/2017/01/05/new-lenses-first-social-mediapresidency.

[10]Archive it.Web Archiving Services for Libraries and Archives[EB/OL].[2019-08-18].http：//www.archive-it.org/

[11]Archive Social.Social media archiving[EB / OL].[2019-08-18].http：//www.archivesocial.com.

[12]LAC.Three-Year Plan 2016-2019[EB/OL].（2018-01-12） [2019-08-18].http：//www.bac-lac.gc.ca/eng/about-us/three-year-plan/Pages/threeyear-plan-2016-2019.aspx.

[13]TNA.The UK Government Web Archive：Guidance for digital and records management teams[EB/OL].[2019-08-18].http：//www.nationalarchives.gov.uk/webarchive/guidance/.

[14]KeesTeszelszky.Web Archiving Down Under ：Relaunch of the Web Curator Tool at the IIPC conference， Wellington， New Zealand[EB / OL].（2018-11-14） [2019-08-18].https：//www.kb.nl/en/news/2018/web-archiving-down-underrelaunch -of-the-web-curator-tool-at-the-iipcconference-wellington-new.

[15]LOC.2013 Update on the Twitter Archive at the Library of Congress[EB/OL].[2019-08-18].https：//blogs.loc.gov/loc/2013/01/update-on-the-twitter-archive-at-thelibrary-of-congress/.

[16]新浪科技.国家图书馆首个互联网信息战略保存基地落户新浪[EB/OL].（2019-04-19） [2019-08-18].https：//tech.sina.com.cn/i/2019-04-19/docihvhiqax3936874.shtml.

[17]Documenting the Now.Community-Based Digital Archives Workshops for Activists[EB/OL].[2019-08-18].https：//www.docnow.io/workshops/call-forapplications/.

[18]Kalev Leetaru.How Much Of The Internet Does The WaybackMachineReallyArchive?[EB/OL].（2015-11-16）[2019-08-18].http：//www.forbes.com/sites/kalevleetaru/2015/11/16/how-much-of-the-internet-does-the-wayback-machine-really-archive/#2715e4857a0b4edc16de88d4.

[19]NARA.Social media and digital engagementpolicies：Facebook policy [EB/OL].（2016-08-15） [2019-07-26].https：//www.archives.gov/social-media/policies/facebook-comment-policy.html.

[20]NPR.Library of Congress’Twitter archive is a huge#FAIL[EB/OL].（2017-11-15）[2019-08-18].https：//www.politico.com/story/2015/07/library-ofcongress-twitter-archive-119698.html.

[21]Facebook.Help[EB/OL].[2019-08-18].https：//www.facebook.com/help/131112897028467.

[22]Bloomberg.Facebook Cambridge Analytica Scandal：10 Questions Answered[EB / OL].（2018-04-10）[2019-08-18].https：//fortune.com/2018/04/10/facebook-cambridge-analytica-what-happened/.

Review and Expectation for the Preservation of Social Media Information on the Internet in China

ZHOU Wenhong

Abstract Research on social media information preservation on the Internet aims to explore the transformation strategy of extending information management from the real world to cyberspace.In this way，information management theory and methods can also be enriched.Using case study method，various models and practical experiences are analyzed to identify the complicated challenges from resources，subjects，objects and methods.Strategies on greater participation of institutions and stakeholders， enhancement of policies and regulations，strengthening of preservation technology and capability，and sustainability of action plans and efforts are proposed.

Keywords the Internet；social media；preservation；information management；web archiving

		自动登录	找回密码
密码			立即注册