據(jù)相關(guān)統(tǒng)計(jì),我國現(xiàn)存古籍約23萬卷,古籍約5000萬卷,可謂鋪天蓋地。這些珍貴的歷史文化遺產(chǎn)內(nèi)容資源豐富,是當(dāng)代科研人員的重要實(shí)物資料。
然而,隨著時(shí)間的推移,我國古籍檔案因各種自然或人為原因受到不同程度的破壞,造成文物流失。因此,在信息社會,保護(hù)和研究古籍檔案是十分必要的。
古籍檔案數(shù)字化是以保護(hù)和開發(fā)古籍檔案為目的,利用計(jì)算機(jī)數(shù)字化技術(shù),將常見的漢字或圖片轉(zhuǎn)化為計(jì)算機(jī)可讀取的數(shù)字符號,從而制作出古籍檔案目錄相關(guān)的數(shù)據(jù)庫或古籍檔案相關(guān)的全文數(shù)據(jù)庫,供展廳使用,展示古籍檔案大數(shù)據(jù)資源的一項(xiàng)工作。古籍工作檔案數(shù)字化不僅有助于古籍檔案的保護(hù),還能有效提高古籍檔案的利用效率,使古籍在科研、史料等方面發(fā)揮作用。
古籍常見問題檔案數(shù)字化
(一)缺乏規(guī)劃和統(tǒng)一的標(biāo)準(zhǔn)
20世紀(jì)80年代以來,我國古籍檔案數(shù)字化處理取得了一定的成績,但由于資金和技術(shù)的不足,仍存在一些問題,在成果的實(shí)用性、通用、可持續(xù)性和有效性等方面還存在諸多不足。
古籍檔案數(shù)字化是一項(xiàng)艱巨復(fù)雜的重復(fù)性工程,涉及各級機(jī)構(gòu)和部門,除這些民間機(jī)構(gòu)和部門外,還包括各級教學(xué)專業(yè)機(jī)構(gòu)、高校圖書館、檔案館和博物館。由于每個單元都是**的,
因此難以進(jìn)行區(qū)域規(guī)劃和聯(lián)合開發(fā)利用,不利于古籍檔案數(shù)字化的發(fā)展和互聯(lián)網(wǎng)后的合作共享,也造成數(shù)字時(shí)代內(nèi)容選題投入的嚴(yán)重浪費(fèi)。比如《四庫全書》的檢索版本多種多樣,間接影響了古籍?dāng)?shù)字內(nèi)容的服務(wù)標(biāo)準(zhǔn)和用戶。
此外,古籍大數(shù)據(jù)沒有統(tǒng)一的編目和標(biāo)引格式,缺乏一套完整的規(guī)范和標(biāo)準(zhǔn)。互聯(lián)網(wǎng)編碼格式數(shù)量龐大且不統(tǒng)一。到目前為止,我國還沒有形成比較完整的全省古籍書目或全文數(shù)據(jù)庫。古籍檔案資源分散,不利于古籍的充分共享和*深層次的研究。
(二)古籍保護(hù)水平不完善。
古籍?dāng)?shù)字化的方向在于紙質(zhì)古籍的多渠道修復(fù)。然而,互聯(lián)網(wǎng)之后的文本信息,由于字體簡單復(fù)雜、文字低俗、同音字和相似字、禁忌字,甚至加上錯別字等復(fù)雜原因,會偏離原意。此外,由于電子計(jì)算機(jī)字體的短缺和古今視野布局的差異,一些古籍?dāng)?shù)字版無法應(yīng)對現(xiàn)代讀者的閱讀習(xí)慣。大多數(shù)影印的古籍與現(xiàn)代格式不同。四頁合并成一頁重新排序后,大部分讀者可能會對影印古籍的排版感到不舒服,造成一定的閱讀困難。
古籍檔案數(shù)字化不僅要求古籍信息的準(zhǔn)確性和及時(shí)性不被嚴(yán)重破壞,還保證數(shù)字化的古籍檔案不能滿足當(dāng)前社會的閱讀習(xí)慣。數(shù)字版版古籍的形成,既是古籍?dāng)?shù)字化轉(zhuǎn)型的終點(diǎn),也需要進(jìn)一步的整理和研究,進(jìn)入大力發(fā)展知識的階段。我國數(shù)字技術(shù)在古籍分析、文本聚類、可視化平臺等方面的應(yīng)用還存在一些不足,無形信息需要隱藏。
(三)相關(guān)情境的知識質(zhì)量還有提升空間。
古籍編目人員不僅要有扎實(shí)的歷史文化知識,還要對目錄學(xué)、文獻(xiàn)學(xué)、版本學(xué)、文獻(xiàn)學(xué)等專業(yè)門類有一定的了解和基礎(chǔ)。此外,他們應(yīng)該能夠更好地掌握古代文學(xué)的知識,從而更大程度地恢復(fù)古籍的內(nèi)容,繼續(xù)發(fā)揮其作用。整理者通常具有一定的古代漢語水平和文獻(xiàn)學(xué)基礎(chǔ),有豐富的古籍保護(hù)經(jīng)驗(yàn),但對現(xiàn)代網(wǎng)絡(luò)技術(shù)和云技術(shù)等信息技術(shù)方面了解不夠。
相反,檔案數(shù)字化的負(fù)責(zé)人可能對電子技術(shù)、網(wǎng)絡(luò)技術(shù)、信息技術(shù)等領(lǐng)域比較熟悉,有扎實(shí)的業(yè)務(wù)能力,但由于缺乏相關(guān)的文化知識和出版古籍的經(jīng)驗(yàn),不勝任這份工作。大數(shù)據(jù)時(shí)代,古籍檔案人員的實(shí)際能力和素質(zhì)影響著古籍的質(zhì)量和效率檔案數(shù)字化,熟悉公司、掌握技術(shù)的專業(yè)人才隊(duì)伍建設(shè)跟不上實(shí)際需求,是數(shù)字化工作過程中不可忽視的問題。新形勢新任務(wù)下,迫切需要提高相關(guān)員工的素質(zhì)、能力和知識,以適應(yīng)社會的需求。
古籍對策檔案數(shù)字化
(一)整體規(guī)劃,建立統(tǒng)一的規(guī)范和標(biāo)準(zhǔn)
為避免相關(guān)部門缺乏全面規(guī)劃導(dǎo)致同一項(xiàng)目重復(fù)生產(chǎn)的現(xiàn)象,古籍工作檔案數(shù)字化需要一個全國性的國際權(quán)威機(jī)構(gòu)進(jìn)行統(tǒng)一管理和協(xié)調(diào),為古籍工作提供財(cái)務(wù)控制和工作指導(dǎo)檔案數(shù)字化。
建設(shè)規(guī)劃可以有效加強(qiáng)內(nèi)部部門之間的聯(lián)系,統(tǒng)籌調(diào)配各部門單位的古籍檔案資源和檔案數(shù)字化工作,及時(shí)制止數(shù)字館藏中的問題并給予指導(dǎo)和配合解決,有效避免產(chǎn)品重復(fù),節(jié)約資源。同時(shí),要建立統(tǒng)一的數(shù)字化升級標(biāo)準(zhǔn)體系,優(yōu)化互聯(lián)網(wǎng)流程,降低古籍在數(shù)字化過程中不兼容的概率,全面實(shí)現(xiàn)古籍檔案數(shù)字化的社會共建,推動數(shù)字化、信息化社會建設(shè)。
(二)選擇珍本書籍作為建立關(guān)系網(wǎng)的基礎(chǔ)。
因?yàn)榻?jīng)濟(jì)原因,古籍會形成不同的版本。不同版本古籍的原始特征,如文獻(xiàn)布局、品牌記載、線條、銘文、藏書等。,會有所不同,而這些細(xì)節(jié)也包含了很多重要的信息。選擇不同版本的數(shù)字化過程,結(jié)果可能會大不相同。
一般來說,相對完善的版本應(yīng)該是古籍?dāng)?shù)字檔案館的首選,*好同時(shí)形成文字和圖形的基本形式,既能進(jìn)行古籍的檢索功能,又能還原古籍的原貌。因此,在古籍檔案數(shù)字化的過程中,應(yīng)盡可能少地選擇善本作為數(shù)字化過程的基礎(chǔ),以便為人們提供更準(zhǔn)確、更詳細(xì)的信息。
(三)提高古籍信息工作者的素質(zhì)和能力。
隨著信息技術(shù)和智力資本的不斷發(fā)展,古籍人員一定要找到終身學(xué)習(xí)的緊迫性,不斷加強(qiáng)對你知識素養(yǎng)的培養(yǎng),自覺提高師德水平,積極豐富檔案學(xué)、新聞傳播學(xué)、歷史學(xué)等知識,學(xué)會掌握一定的計(jì)算機(jī)技能,熟練支撐信息學(xué)和***的硬件知識,進(jìn)而提高古籍歸檔和業(yè)務(wù)能力的質(zhì)量。
各部門還應(yīng)定期開展相關(guān)學(xué)習(xí)和培訓(xùn),為負(fù)責(zé)人員業(yè)務(wù)能力和知識素養(yǎng)的提升提供幫助;應(yīng)建立在職碩士培養(yǎng)體系,啟動檔案技術(shù)崗位評價(jià)體系,重點(diǎn)培養(yǎng)掌握檔案管理技能并具備信息技術(shù)和現(xiàn)代背景信息的人才。古籍檔案數(shù)字化順應(yīng)了信息世界對網(wǎng)絡(luò)化、信息化進(jìn)程的要求,是大勢所趨。但是目前我國古籍檔案數(shù)字化的發(fā)展還不成熟,還有很多朋友的問題。各成員單位要積極配合古籍?dāng)?shù)字化檔案工作,相互配合協(xié)調(diào),積極開展數(shù)字化建設(shè),共同推進(jìn)古籍?dāng)?shù)字化管理和利用。