发新话题
打印

文件组成“三要素说”献疑

引用:
原帖由 伍振华 于 2012-8-5 19:18 发表

  刘东斌先生的"档案形成在前论"立论的大前提是存在问题的,是基于对档案的原始记录性的片面理解而形成的结论,将原始记录脱离于与之相对应的形成活动,没有看到原始记录形成活动对原始记录性的决定作用。此外,"档案形成在前论"在没有准确理解原始记录性实质的基础上,也没能把握其实质意义和作用,甚至以异化概念来支撑论点。

——归吉官(2009)
http://www.danganj.net/bbs/viewthread.php?tid=44208&page=3

TOP

  
Abstract
This paper describes the Social Networks and Archival Context project, built on a database of merged Encoded Archival Context - Corporate Bodies, Persons, and Families (EAC-CPF) records derived from Encoded Archival Description (EAD) records held by the Library of Congress, the California Digital Library, the Northwest Digital Archives, and Virginia Heritage, combined with information from name authority files from the Library of Congress (Library of Congress Name Authority File), OCLC Research (The Virtual International Authority File), and the Getty Vocabulary Program (Union List of Artist Names). The database merges information from each instance of an individual name found in the EAD resources, along with variant names, biographical notes and their topical descriptions. The SNAC prototype interface makes this information searchable and browseable while retaining links to the various data sources.
  
——Ray R. Larson… in Research and Advanced Technology for Digital Libraries (2011)

TOP

三、Inter PARES 1和2的主要成果

  
  Inter PARES项目根据每个阶段的研究设计产生了各种类型的调查询问结果。本文仅介绍两个主要结果, 应为这两个结果与本文重点讨论的问题最为相关:即数字文件的识别工具和保管链 (COP) 模型。还有几个Inter PARES 1和2的成果应用于第三阶段的工作中, 如果需要, 后面再予以介绍。
  用于识别数字文件的工具称为档案文献分析模板 (以下称为模板) , 包含了反映源于文件身份鉴定学和档案学这两个学科中文件概念的模块。如上所述, 这两个学科已经发展至彼此互补的知识, 一个用于单份文件, 另一个用于文件联合体。模板采用了两种类型的知识, 这两类知识的应用对鉴定文件的真实性还有一个附加的目的, 即识别数字文件, 鉴定数字对象文件在文件生成者各项活动中生成时的状态。对数字对象的文件状态进行鉴定的需求源自对这类实体的观察, 即, 虽然这些实体或许能够满足文件生成者开展活动的直接目标, 但由于以下原因导致不能实现长期保存文件的功能, 比如, 技术使得文件的内容、形式或两者轻易被改变, 或完全消失。换句话说, 数字对象可能不具有固定的形式和稳定的内容, 但是它们需要予以固化以实现文件的功能。在鉴定文件真实性之前先要对文件的状态进行鉴定, 因为在没有确定某一文件的真实性前, 文件的真实性没有受到质疑, 文件仍然可用, 但是容易被改变或不断改变的对象对于发生在最近一刻的改变之前的行为理解毫无疑问是无用的。如上所述, 文件身份鉴定学和传统档案学所研究的文件都是稳定存在于载体上的文件, 因此没有明确地确定对文件稳定性的要求。模板通过纳入Inter PARES对数字文件特性的研究结果来解决这一问题。利用模板, 对数字对象的文件状态和真实性的鉴定可以同时进行:分析的结果可以是一份文件 (也可以不是一份文件) 或是真实的文件 (或不真实的文件、被篡改过的文件) , 取决于数字对象可满足模板中条件的满意度。模板中的数字对象有五种状态:
  具有稳定的内容和固定的形式, 并附着在载体上 (Inter-PARES成果) ;
  涉及某一行为 (文件身份鉴定学和档案学) ;
  表现形式为档案全宗 (档案学) ;
  涉及五类人员, 即, 作者、撰文者、受文者、形成者和发起者 (文件身份鉴定学、档案学和Inter PARES研究发现) ;
  存在五种可识别的环境, 即, 司法——行政环境[1], 来源环境[2]、程序环境[3]、记录环境和技术环境。
  COP模型囊括了包含UBC项目成果在内的已有的全部Inter PARES数字文件研究成果。如是, 它涵盖了以真实形式保存数字文件相关的所有活动, 并描绘了达成此目的的完整过程。换句话说, 它既包括文件形成者执行的活动, 也包括文件保存者执行的活动。在最高层次, 它由四大活动构成:管理COP框架, 管理文件形成系统中的文件, 管理文件管理系统中的文件, 以及管理永久[4]保存系统中的文件, 这些大活动又包含各个层次的子活动。COP框架的管理包括对上述三个系统的设计, 产生诸如政策、程序、规则、工具和技术系统的功能需求等产品。对文件形成和管理系统的管理包括文件管理相关活动, 对永久保存系统的管理包括档案管理相关活动。由此, 该模型集成了文件形成者和文件保存者的视角。模型的完备性使其成为任何旨在保存数字文件的工作的指南;同时, 模型为活动和相应结果提供了定义, 从而保障了具体实施的灵活性和可修正性[5]。

——InterPARES项目:成果回顾与未来方向  谢丽; 王健; 马林青 档案学研究  2017-04-20
上文链接:
http://www.danganj.net/bbs/viewt ... age%3D3&page=11
105#

TOP

  
  2.三种类型的信息包
  (1)移交信息包
  移交信息包是文件从形成者向OAIS移交时所形成的信息包。形成者和OAIS的协议中明确了SIP的具体形式。SIP概念强调了一个事实:文件未必按照其移交时的形式保存。例如,保存信息也许是由多个SIP所提交的信息内容组合,或形成者提供的信息不支持OAIS格式。因此,在转入归档文件库时,必须转换成另一种格式。而在形成者所提供的元数据不完整、不充分的情况下,在移交过程中,必须增加一部分。
  (2)归档信息包
  归档信息包是信息在OAIS存储并保护过程中形成的。AIP包含了数字文件在保管和存取过程中形成的信息,包括一整套用于支持其保护和存取的元数据。归档文件及相关元数据代表一个逻辑包,一般而言,它们的实体整理由OAIS的实施者完成,解决方案有两种:一是作为一个整体,统一保管,如在文件中嵌入元数据;二是采用实体分开、逻辑联系的方法。
  (3)发布信息包
  发布信息包是应查询请求将信息包传送给用户。DIP强调一个事实,即OAIS向用户发布的信息包与归档信息包在内容和形式上都有可能不同。例如,图像文件在传输之前,可以从TIFF格式转换成JPEG格式;在内容数量上,一个DIP可以是一个或者多个甚至只是部分AIP;在传输的相关元数据方面,DIP并不需要包含一套完整的相关元数据,因为许多元数据对于利用者并无多大意义。

——杨迪:基于OAIS模型的归档接口实现(2016)
上文链接:
http://www.danganj.net/bbs/viewt ... page%3D1&page=2
15#

TOP

    
  档案本身,就包括了档案工作在内的意思。因为档案的产生是出自档案工作的结果。档案在形成以前是以文书( 文件材料) 的形式存在的, 文书只有在经过档案工作者的鉴定、整理之后, 才得以成为档案。可以说, 档案和档案工作是相伴产生的。档案工作产生于档案形成的过程;档案是通过一定程序才形成的, 这一定的程序就是档案工作。
  
—— 为“中国档案史”正名  查启森  图书情报知识  1991-10-01
http://www.danganj.net/bbs/viewt ... ;extra=&page=14
132#

TOP

  
  摘    要:
  元数据是电子文件管理的基本工具, 在维护电子文件真实、完整、可用、可理解等方面的重要作用已经得到了广泛关注。目前, 国际主流的与电子文件管理相关的元数据模型中, 没有任何一个模型的设计初衷是面向电子文件保存的。与此同时, 电子文件保存单位元数据管理的需求又在呼唤着统一模型的出现。本文以保护既有应用、支持持续管理、坚守专业原则、采用模块化设计思路等为原则, 从业务逻辑、实体及其级次、实体关系等方面对ISO 23081、PREMIS、PRONOM模型予以分析、对比与整合, 面向电子文件保存构建元数据模型, 主要包括文件、技术环境、责任主体、业务、法规标准五个实体。该模型可以与现有主流模型建立映射, 为支持文件保存机构设计元数据应用纲要提供统一的概念基础和体系框架。
  关键词:
  电子文件; 数字保存; 元数据模型; 互操作;

——面向电子文件保存的统一元数据模型的构建 刘越男等(2017)
下文链接:
http://www.danganj.net/bbs/viewt ... age%3D1&page=16
159#
相关链接:
http://www.danganj.net/bbs/viewthread.php?tid=17224&page=16
159#

[ 本帖最后由 伍振华 于 2017-12-7 15:19 编辑 ]

TOP

  
(二)内涵分析

  档案内容管理的对象是档案内容,要理解档案内容管理的内涵需要厘清档案内容的本质。档案内容的属概念是内容,首先需要分析内容的基本内涵。关于内容可以从字面、本质、哲学和技术等不同角度理解,[13]《辞海》对其解释是:“物件里面所包容的东西;事物内部所含的实质或意义”。前者是从字面理解,后者是从本质和哲学的角度解释。内容与形式相对应,强调对象本身的信息而不是关于对象的信息。因此,借用到信息学中,可以将其定义为数字环境下组织内部的全部信息资料的总和,包括表单、文本、图像、视频等等。

  在数字环境下,档案是一种重要的信息资源和知识资产,可以视为组织“内容”的重要组成部分。在档案内容管理中,档案内容是指依托于档案载体但又不包括档案载体的知识内容,它是表达档案本质的最核心部分。一般来说,档案主要由源于档案的信息和关于档案的信息组成,[14]因此档案并不全是档案内容,档案只有被人们抓取或者挖掘,赋予可利用的形式成为档案知识之后,才能称为档案内容。

——档案内容管理及其对现代档案工作的启示 郝琦; 魏扣 北京档案 2016-05-20
下文链接:
http://www.danganj.net/bbs/viewt ... extra=&page=104

TOP

  
4 档案数字资源质量管理术语研究
4.1 质量———档案数字资源质量内涵
ISO 9000标准中的“质量”是指“一组固有特性满足要求的程度”, 而“要求”包括“明示、通常隐含的或必须履行的需求或期望”。因此, 档案数字资源的“固有特性”是其区别于其他事物的独特性。根据上述档案数字资源的定义、内涵和属性分析, 其质量的内涵如下:
(1) 真实性:在合规可信的信息管理系统中形成、收集、整理、鉴定、保存、迁移、利用 (原生电子档案和基于此环境产生的档案开发产品还具有“原始记录性”) , 反映档案数字资源的内容、结构、背景信息, 并可追溯其生命周期的任一个阶段;
(2) 完整性:在合规可信的信息管理系统中, 不仅反映信息的内容, 也反映其结构、背景, 同时也反映档案数字资源之间的有机联系性;
(3) 有效性:能借助计算机系统或移动终端查阅、打开、再现信息, 提供利用;
(4) 安全性:确保档案数字信息资源不泄密、不篡改、可长期保存和使用。隐含和必须履行的需求是信息管理系统安全、数据仓储安全、网络安全、硬件设施安全、备份安全、服务安全。
  
——基于ISO 9000的档案数字资源质量管理分析及术语释义 徐华 档案学研究 2017-12-28
上文链接: 
http://www.danganj.net/bbs/viewt ... age%3D2&page=13 127#

TOP

  
  二、电子文件概念发展及其成文制式的构成要素

文件身份鉴定学对电子文件的定义是着眼于单个文件, 而不同于档案学定义文件联合体, 并且融入了数字技术带给文件形成单位和档案界的挑战。档案学者杜蕾蒂认为电子文件是可以在数字信息系统中, 识别和解释它的必要和充分因素的, 文件身份鉴定学对各种类型电子文件的分析, 展示的电子文件构成的必要元素包括:介质、内容、物质和意识的形态、行为、人物、上下文关系、背景。
电子文件的成文制式是文件身份鉴定学分析的主要对象, 它是指依据文件的内容、管理、成文背景和权限之间的关系所制定的表达规则。根据档案学者杜蕾蒂的研究, 在文件身份鉴定学中, 每份电子文件的成文制式应该拥有的五项元素包括:
(一) 固定的格式
(二) 创建的行为
(三) 同一文件处理行为中与之相关的其它文件
(四) 文件创建中法定的 (发件人、收件人、抄送人)
(五) 可辨别的文件参与的框架 (包括有关行政的、来源的、过程的、纪实的和技术的背景)

按照这些元素对电子文件所起的不同作用, 电子文件的成文制式又可以分为外在元素和内在元素。外在元素包括电子文件所有的外在特点, 和文件在执行、处理、管理和保存过程中加入的注释。比如背景、上下文关系, 图像、图表和音频, 以及具体的特点 (字体、超链接、特殊的布局和解决, 规模、取样率) , 电子签名、日期印章、以及特殊的签名、原创者的标识等。外在元素决定文件的构成和外表, 并使文件完善, 即可以实现目标。

通过结构表达内容的文件的内在元素包括:作者、姓名、创建者姓名、日期、发件人地址、收件人姓名、主题、标题、认证、操作描述。这些因素的存在使电子文件完整, 通过分析这些因素, 可以确认文件身份和跟踪它的完整性。

这里文件的成文制式与传统文件有着很大区别。比如电子邮件的日期, 一份邮件包含几种日期, 创建日期、文件发送日期、归档日期、检索日期, 所有这些日期证明文件的可靠性和真实性。文件的签名也存在同样的情况, 在电子邮件中, 文件没有签名的功能, 用具有混合功能的数字签名来替代, 而数字签名是理念上的印章, 它可立即证明文件的收件地址。

——文件身份鉴定学视角下对电子文件真实性管理的分析 黄睿 黑龙江档案 2017-10-15

TOP

  
  因而, 收集电子文件必须注意其完整性, 电子文件的背景信息和元数据与内容同样重要。电子文件的背景信息收集应在电子文件形成时就开始着手, 这涉及识别与标记电子文件, 涉及将电子文件与背景相连接。在某些情况下, 还需要将关键的背景信息植入到元数据中或电子文件自身中来达到这一目的, 电子文件所产生的自我描述信息越多, 对补充信息的需要就越少。

——电子文件的全程管理与前端控制的比较研究 郑伽 北京档案 2017-10-20
上文链接:
http://www.danganj.net/bbs/viewt ... page%3D1&page=4

TOP

发新话题

郑州档案数字化