一、明清檔案的整理與演變
《檔案學(xué)辭典》認(rèn)為,整理歸檔是指“檔案機(jī)構(gòu)根據(jù)文獻(xiàn)在來源、內(nèi)容、時(shí)間、形式等方面的文化聯(lián)系,對檔案進(jìn)行系統(tǒng)的分類、組合、整理和編目。”文獻(xiàn)檔案的整理無疑是一種紀(jì)念工作。
文獻(xiàn)校勘之所以具有代表性,主要有三個(gè)原因:一是校勘對象的特殊性,珍貴史料既具有一般檔案的共性,又因其歷史悠久、不可互補(bǔ)性而具有一定的藝術(shù)價(jià)值;其次,整理方法的特殊性,歷史文獻(xiàn)的內(nèi)容和載體不再自然,需要在整理過程中有特殊的整理方法;第三,校勘理論的局限性。對于珍貴的史料,現(xiàn)有的新聞傳播學(xué)理論和研究更多地關(guān)注其作為檔案的普遍性,而忽視了其作為史料的個(gè)性,這也造成了文獻(xiàn)檔案整理理論的特殊性。
中國**國家檔案館成立90年來,建檔工作經(jīng)歷了文獻(xiàn)博物館時(shí)期、明清時(shí)期、1980-2010年、2011年四個(gè)階段。
圖書館時(shí)期的整理與歸檔。作為故宮下屬的三級(jí)機(jī)構(gòu),已經(jīng)開始收集整理檔案。這一時(shí)期的主要工作是接收和集中散落各處的清代檔案,并進(jìn)行初步清查。當(dāng)時(shí),在戰(zhàn)爭頻繁的環(huán)境下,文件經(jīng)常丟失和轉(zhuǎn)移,數(shù)據(jù)收集受到很大影響。但在當(dāng)時(shí)學(xué)者的堅(jiān)持下,原本雜亂的明清檔案隨波逐流,整理出它們的76個(gè)脈絡(luò),分門別類,構(gòu)建了它們的體系,初步奠定了整理清代檔案的基礎(chǔ)。
明清檔案。這一時(shí)期的檔案工作具有承前啟后的特點(diǎn)。一方面將之前散落各地的明清檔案繼續(xù)接收,對于宗人府等尚未整理的檔案,將進(jìn)行大致分離存放,以備下一步整理。另一方面,及時(shí)總結(jié)整理經(jīng)驗(yàn),不斷探索,逐步熟悉和嘗試整理不同系統(tǒng)的檔案,建立了較為科學(xué)完整的整理模式,鞏固了現(xiàn)有的檔案基礎(chǔ)。其中,影響較大的是副奏折的18類記載、內(nèi)閣官職按題材劃分等。可以說,這一時(shí)期是立案工作的重要時(shí)期,奠定了一直沿用至今的全家庭監(jiān)護(hù)制度和檔案層級(jí)的基礎(chǔ)。
1980年國家檔案館**后,人員迅速增加,整理隊(duì)伍不斷壯大,進(jìn)入均衡發(fā)展時(shí)期。在這個(gè)階段,檔案的整理基本上延續(xù)了以前的模式和方法,從檔案層面到檔案層面。總的編排方式是:集卷-分塊-逐漸編號(hào)-加信封-寫標(biāo)題等。同時(shí),對于系譜系統(tǒng)不同的檔案,也區(qū)分了不同的排序標(biāo)準(zhǔn)和層級(jí)體系。2011年初,根據(jù)“五年整理歸檔計(jì)劃”,檔案室進(jìn)入新的整理階段。在后續(xù)階段,我們采用計(jì)算機(jī)輔助排序,采用外包模式,并根據(jù)數(shù)據(jù)歸檔的具體情況制定數(shù)據(jù)歸檔方案和細(xì)則。通過8個(gè)簽約項(xiàng)目,我們完成了內(nèi)閣、軍務(wù)部長、皇宮中學(xué)60個(gè)檔案館5243647(冊)檔案的整理工作。
Ii.歷史檔案數(shù)字化排序
2011年,我館提出了“五年數(shù)據(jù)歸檔計(jì)劃”,這是社會(huì)化過程的**個(gè)外包安排模式。通過高度標(biāo)準(zhǔn)化、模塊化、規(guī)范化的過程監(jiān)督,并輔以計(jì)算機(jī)網(wǎng)絡(luò)管理數(shù)據(jù),對我館現(xiàn)有檔案進(jìn)行整理進(jìn)行了新的嘗試。中國**國家檔案館檔案數(shù)字化工作的深化,產(chǎn)生了大量珍貴史料的數(shù)字化影印,積累了海量的歷史文獻(xiàn)資料。*大的特點(diǎn)是:
1.館藏?cái)?shù)字檔案規(guī)模龐大。從文獻(xiàn)層面來看,我們圖書館的檔案數(shù)以千萬計(jì),從電子證據(jù)來看,這是天文數(shù)字。單從2011年5月以來的編譯結(jié)果來看,每年編譯的文件超過160萬個(gè),電子證據(jù)近4000TB,數(shù)字時(shí)代可使用的幀數(shù)超過3200萬幀。
2.字段很多,一個(gè)檔案的價(jià)值信息也是數(shù)不勝數(shù),比如負(fù)責(zé)人、時(shí)間、職位、地區(qū)、檔案號(hào)等幾十個(gè)信息字段。然而,在我們圖書館的檔案中,不同的檔案歸檔時(shí)會(huì)輸入不同的信息字段。例如,如果排列了宮中朱批紀(jì)念類的物品,則需要錄入朱批的內(nèi)容,但在屬于朱批紀(jì)念類的物品檔案中,則不需要此錄入字段。
3.價(jià)值密度小,數(shù)據(jù)歸檔過程中必須錄入一些數(shù)據(jù)。然而,對于用戶來說,不同的目的和需求,不同的文件和信息選擇,導(dǎo)致數(shù)據(jù)使用頻率高,吸收效率差異大,在一定程度上降低了價(jià)值密度。
4.人的主觀判斷與差異化管理。以往的整理歸檔主要是以個(gè)人觀望為主,每個(gè)人**承擔(dān)幾個(gè)環(huán)節(jié),難以替代,受“人”因素影響。但是現(xiàn)在的歸檔工作需要時(shí)代的發(fā)展,這種整理模式的作用和帶來的麻煩都是顯而易見的。借助計(jì)算機(jī),可以*大程度地避免這種影響。任何時(shí)候都不可能用數(shù)字技術(shù)快速有效地整理珍貴的史料,尤其是數(shù)千萬的明清檔案。技術(shù)與電腦整理結(jié)合采用大規(guī)模外包模式,現(xiàn)在可以實(shí)現(xiàn),原因有以下三(條件):
1.現(xiàn)代科學(xué)的發(fā)展學(xué)技術(shù)。與過去相比,如今,計(jì)算機(jī)已經(jīng)成為應(yīng)用*廣泛的輔助整理工具,并設(shè)計(jì)了高清攝像頭、聯(lián)網(wǎng)系統(tǒng)、多交互操作軟件等。,都提供技術(shù)支持。
2.專業(yè)服務(wù)公司建設(shè)。與過去相比,專業(yè)化分工進(jìn)一步細(xì)化,出現(xiàn)了能夠提供歷史數(shù)據(jù)整理和外包業(yè)務(wù)功能的專業(yè)化企業(yè)。這些公司可以根據(jù)歸檔工作的需要設(shè)計(jì)相應(yīng)的程序,并提供足夠的設(shè)備操作,以流水線的生產(chǎn)模式輸入、整合和保存所需的檔案信息。
3.各領(lǐng)域理論的整合。在跨學(xué)科、跨學(xué)科融合成為現(xiàn)實(shí)的今天,計(jì)算機(jī)輔助歷史文獻(xiàn)整理得到了更多的支持,如網(wǎng)絡(luò)化產(chǎn)品與整理歸檔環(huán)節(jié)的工業(yè)流水線相結(jié)合,可以提高效率;企業(yè)管理理論應(yīng)用于數(shù)據(jù)歸檔人員管理,使標(biāo)準(zhǔn)化生產(chǎn)成為可能,等等。
三五年來的備案情況及特點(diǎn)
就珍貴史料具體數(shù)據(jù)的整理而言,我們在收集、整理、儲(chǔ)存和處理數(shù)字檔案的過程中,不應(yīng)被數(shù)據(jù)沖昏頭腦,而應(yīng)冷靜對待。基于云計(jì)算的用戶行為體驗(yàn)的運(yùn)行規(guī)律,在一定程度上演繹了基于利用的整理思想范式,也提供了文獻(xiàn)檔案整理的基礎(chǔ)分析。
關(guān)于創(chuàng)新革命推動(dòng)各行業(yè)啟動(dòng)量化進(jìn)程的事實(shí),哈佛歷史教授加里·金
描述:“這是一場革命。大數(shù)據(jù)的巨大資源讓各行各業(yè)都開始了量化的過程,這個(gè)過程在任何領(lǐng)域都會(huì)開始,無論是歷史、商業(yè)還是政府。與手工作坊的歷史整理歸檔不同,我館實(shí)施的大規(guī)模珍貴史料量化整理,其特點(diǎn)是持續(xù)推行產(chǎn)品的標(biāo)準(zhǔn)化和廣泛性。
自“大數(shù)據(jù)云計(jì)算”概念引入以來,我們通過五年來的歸檔實(shí)踐,重新思考了歷史數(shù)據(jù)整理的內(nèi)涵和外延。系統(tǒng)構(gòu)建的整理操作步驟、數(shù)據(jù)接口和程序功能在整理實(shí)踐中不斷完善。在排序的實(shí)際層面上,我們遵循了《館藏檔案整理總體方案》(2011—2015)中“維護(hù)現(xiàn)有的整個(gè)文件設(shè)置和原始文件文件庫”的排序原則。在文件級(jí)排序時(shí),我們基于我館3月《劃分館藏檔案文件級(jí)基礎(chǔ)保管單位件的原則及標(biāo)準(zhǔn)》確定文件中的文件級(jí)托存單位“件”,給出文件級(jí)文件號(hào),并根據(jù)本項(xiàng)目的排序?qū)嵤┓桨讣跋嚓P(guān)規(guī)則形成檢索數(shù)據(jù)。卷中的每個(gè)文件都配有一個(gè)信封,并配有條形碼。
1.操作流程標(biāo)準(zhǔn)化。在揚(yáng)棄傳統(tǒng)整理工藝的基礎(chǔ)上,我館的整理實(shí)踐立足于
項(xiàng)目外包的模式充分利用現(xiàn)代信息技術(shù)技術(shù),兼顧質(zhì)量和速度,在確保文件、檔案“一物不丟、一物不亂”的安全框架內(nèi),妥善規(guī)范整理流程。我們針對珍貴史料探索出了一套通用性強(qiáng)的整理流程,即:預(yù)處理—人工組卷整理—計(jì)算機(jī)化信息提取、整理—人工驗(yàn)證—添加文件級(jí)信封、實(shí)體整理—包裝貼標(biāo)、成品質(zhì)量檢驗(yàn)—暫返庫—進(jìn)入數(shù)字化處理階段—進(jìn)入實(shí)體文件的存儲(chǔ)與封存—進(jìn)入數(shù)據(jù)虛擬描述階段:
2.數(shù)據(jù)接口標(biāo)準(zhǔn)化過程。在數(shù)據(jù)庫中構(gòu)建框架時(shí),設(shè)置收集元素字段的El。
統(tǒng)一的計(jì)時(shí)標(biāo)準(zhǔn)。在保留所有傳統(tǒng)字段信息(檔號(hào)、責(zé)任者、職官、文種、時(shí)間、文字種類、件數(shù)、面數(shù)、畫幅數(shù)、破損情況、備注等)的基礎(chǔ)上,我們?yōu)椴煌后w提供基于界面生成的個(gè)性化定制相關(guān)數(shù)據(jù)庫。例如,在編制排序順序目錄時(shí),根據(jù)需要將相關(guān)條目與標(biāo)準(zhǔn)字體段分開。
3.規(guī)范程序功能管理。考慮到檔案工作成果數(shù)據(jù)的集成和共享,它對應(yīng)不同的
目錄業(yè)務(wù)需求由相應(yīng)目錄數(shù)據(jù)庫中的優(yōu)化軟件程序模塊生成。例如,倉庫存儲(chǔ)的需求會(huì)生成一個(gè)包含文件位置信息和損壞程度等重要信息的目錄數(shù)據(jù)庫系統(tǒng)。無論滿足什么樣的需求,都是基于一個(gè)通用的程序功能。
更加注重正相關(guān)而不是因果數(shù)據(jù)思維,使我們對歷史數(shù)據(jù)歸檔的內(nèi)涵有了新的認(rèn)識(shí),即歷史文獻(xiàn)的整理是分層次、分維度的,沒有一勞永逸。我們對文化整理歸檔數(shù)字化改造和描述的實(shí)踐,通過件與件、卷與卷、項(xiàng)與項(xiàng)、類與類、全案與全案之間的數(shù)據(jù)整合,通過關(guān)聯(lián)形成人機(jī)協(xié)同,通過交互和挖掘發(fā)現(xiàn)新的價(jià)值。
要突破信息鎖定的傳統(tǒng)整理思維,**步是克服其他傳統(tǒng)數(shù)據(jù)形成的數(shù)據(jù)孤島,搭建數(shù)據(jù)信息共享平臺(tái),形成既面向歷史又面向未來、充滿開放珍貴史料的大數(shù)據(jù)云計(jì)算。
組織內(nèi)涵的開放性。在實(shí)際的文獻(xiàn)檔案整理工作中,有對珍貴史料因果關(guān)系的嘗試。
澄清欲望。然而,傳統(tǒng)的整理實(shí)踐告訴他們,這種讓所有意圖都清晰的想法幾乎是無法解決的。然而,我們卻進(jìn)入了西方本體論中一個(gè)叫“解釋的循環(huán)”的陷阱,錢鐘書曾用古雅細(xì)膩的文言文翻譯過:“小品使大品明,大品使小品明;把終點(diǎn)推到終點(diǎn),探索終點(diǎn)到貧困終點(diǎn);相互往復(fù),容易弄圓,避免偏燥,所謂‘闡釋之循環(huán)’就是“易”。
換言之,“解釋的循環(huán)”深刻傳達(dá)了傳統(tǒng)檔案工作思想的困境。我們努力準(zhǔn)確地恢復(fù)單個(gè)文件的任何信息元素,同時(shí)對整個(gè)檔案進(jìn)行詳細(xì)而全面的描述。這種在單檔和全家福之間給出滿意解釋的意圖,恰恰證明我們陷入了因果鏈陷阱。
大數(shù)據(jù)的出現(xiàn)改變了人們的思維框架和認(rèn)知形式。在“數(shù)據(jù)驅(qū)動(dòng)”的觀點(diǎn)下,數(shù)據(jù)的雜糅性優(yōu)于準(zhǔn)確性,數(shù)據(jù)的宏觀調(diào)控高于微觀推敲。在數(shù)據(jù)挖掘中,我們放棄了對因果關(guān)系的渴求,專注于對各種社會(huì)關(guān)系的整體數(shù)據(jù)分析,即因果關(guān)系的邏輯讓位于數(shù)據(jù)之間的線性關(guān)系。檢查數(shù)據(jù)之間“互反”的正相關(guān)關(guān)系,這可以通過實(shí)證主義在人類認(rèn)識(shí)活動(dòng)領(lǐng)域倡導(dǎo)的交往理性得到證明。
檔案本身豐富的校勘脈絡(luò)為校勘活動(dòng)設(shè)置了鮮活的概率,而校勘脈絡(luò)的動(dòng)態(tài)系統(tǒng)理論上決定了校勘理念始終在進(jìn)行,因此校勘活動(dòng)始終是開放的、創(chuàng)造性的、永無止境的。
以數(shù)據(jù)歸檔整理為例,“五年歸檔工作規(guī)劃”出臺(tái)前85年的整理實(shí)踐表明,“如何整理文獻(xiàn)”是整理歷史文獻(xiàn)的基本點(diǎn),也是爭論不休的熱點(diǎn)話題。館藏珍貴史料的具體情況極其復(fù)雜,導(dǎo)致對“片”的內(nèi)涵和外在外延缺乏準(zhǔn)確、權(quán)威的標(biāo)準(zhǔn)。我館過去整理部品的具體做法:主要部品附件與個(gè)別件有爭議,內(nèi)容相關(guān)的部品與實(shí)物形狀制作的部品有爭議,一組文獻(xiàn)與文獻(xiàn)集有爭議。2011年《劃分館藏檔案文件級(jí)基礎(chǔ)保管單位(件)的原則與標(biāo)準(zhǔn)》的實(shí)施意見可以看作是對這個(gè)問題的權(quán)威調(diào)解。但是根據(jù)大數(shù)據(jù)環(huán)境下的整理實(shí)踐,這個(gè)整理問題幾乎是可以克服的。在數(shù)字虛擬空間中,關(guān)鍵是零件之間的正相關(guān)。簡而言之,對A部分的判斷高度依賴于它與相關(guān)B、C、d部分的關(guān)系,我們可以通過獲取數(shù)據(jù)搜索網(wǎng)站,根據(jù)相關(guān)度創(chuàng)建所有片段的集合。這樣,關(guān)于“零件”的爭論將被取消,它將不再作為一個(gè)實(shí)體是可有可無的。
2.結(jié)果是公開的。
方輝在《瀛奎律髓》中指出:詩人有很大的判斷和總結(jié)。我館《五年歸檔工作規(guī)劃》是在總結(jié)我館歸檔歷史規(guī)律、把握“大數(shù)據(jù)時(shí)代”歸檔工作發(fā)展路線的基礎(chǔ)上,結(jié)合我館歷史文獻(xiàn)真實(shí)情況做出的“重大判斷”。檔案收集整理分為五個(gè)階段。截至2015年4月,我們已經(jīng)完成了檔案整理項(xiàng)目的前四個(gè)階段。根據(jù)項(xiàng)目的整理實(shí)踐,這四個(gè)時(shí)期可以稱為“總結(jié)歸納”。對于整理珍貴史料思想中試圖還原檔案產(chǎn)生情況和原始聯(lián)系的理想而言,“五年檔案規(guī)劃整理”無疑是一大裨益。經(jīng)過整理后再進(jìn)行全面數(shù)字化改造的珍貴史料,在克服了傳統(tǒng)的紙質(zhì)檔案孤島后,將與包括大數(shù)據(jù)在內(nèi)的所有信息形成明清檔案。到那時(shí),通過適當(dāng)?shù)臄?shù)據(jù)引擎,我們可以完全組織各種軟件定義,而不會(huì)傷害到物理文件。
記錄人類活動(dòng)的珍貴史料承載著個(gè)人無法控制的各種信息資源。當(dāng)數(shù)字化完成并整合到電子檔案中后,借助數(shù)據(jù)引擎,我們可以在復(fù)雜運(yùn)算和分析的基礎(chǔ)上,對數(shù)值模擬和演示進(jìn)行深入研究,我們完全有可能看到更多塵封往事的真相,解開更復(fù)雜、更隱秘的歷史謎團(tuán)。這表明人們利用數(shù)字檔案積極獲取、標(biāo)注、比較、采樣和解釋文化知識(shí),這充滿了很多機(jī)會(huì)。這也從根本上改變了歷史數(shù)據(jù)歸檔結(jié)果的單一性和強(qiáng)封閉性。



