隨著知識爆炸的到來,傳統(tǒng)載體檔案數(shù)字化數(shù)量增多,中共中央組織部發(fā)布《關(guān)于加強(qiáng)和改進(jìn)新形勢下檔案工作的意見》,要求重點推進(jìn)傳統(tǒng)載體檔案數(shù)字化,切實推進(jìn)檔案保管網(wǎng)絡(luò)化、網(wǎng)絡(luò)化。
新《檔案法》修訂版還增加了檔案數(shù)字化的規(guī)定。隨著鄉(xiāng)鎮(zhèn)檔案局新館建設(shè)的完成,數(shù)字檔案館(室)的建設(shè)將是下一階段的重點,因此檔案數(shù)字化處理的重要工作將逐步展開。國家檔案館2017年8月發(fā)布的《紙質(zhì)檔案數(shù)字化規(guī)范》規(guī)定了紙質(zhì)檔案數(shù)字化設(shè)備的要求和管理規(guī)定,山東省也對《文書檔案目錄數(shù)據(jù)采集規(guī)范》進(jìn)行了修訂。這些部門規(guī)章對市級檔案館檔案數(shù)字化具有重要意義(室)。
但是在工作進(jìn)展的過程中,會因各檔案館(室)卻處于不同的情況,遇到了奇怪等細(xì)節(jié)。因此,需要根據(jù)不同情況,解決現(xiàn)場遇到的問題,從而檔案數(shù)字化規(guī)范處理結(jié)果的管理,便于其利用。
加工程序的選擇
檔案數(shù)字化加工主要有兩種形式。一是檔案室(室)及時組織自己的處理,二是外包給有資質(zhì)的公司,各有利弊。自行處理有利于檔案的保密和保存保護(hù)。
但從預(yù)掃描、掃描、圖像處理、質(zhì)檢、圖像合成、目錄描述,到數(shù)據(jù)驗收、數(shù)據(jù)勾連,每道工序一人需要8-10人,而檔案館(室)普通人分散,完全滿足工序間人員的要求。但從社會角度來看,招聘在專業(yè)性方面是可以保證的,涉及到很多人事管理問題。此外,還需要自己購買文件掃描、圖像處理等各種設(shè)施和軟件,需要投入大量資金。外包服務(wù)模式,因為公司項目專業(yè)化管理,人員設(shè)備不用擔(dān)心檔案機(jī)構(gòu)。只要檔案數(shù)字化方案制定合理,檔案機(jī)構(gòu)管理得當(dāng),檔案數(shù)字化的效率和質(zhì)量還是可以保證的。因此,對于大規(guī)模檔案數(shù)字化加工,筆者還是以外包企業(yè)為主。
數(shù)字處理的監(jiān)督和指導(dǎo)
(一)生產(chǎn)計劃的確認(rèn)
紙質(zhì)檔案數(shù)字化方案要求各種數(shù)字化對象、創(chuàng)作目標(biāo)、工作內(nèi)容、數(shù)字化產(chǎn)品方法和主要技術(shù)性能、驗收依據(jù)、人員配置、任務(wù)分工、總體方案、安全生產(chǎn)措施等。技術(shù)規(guī)范:根據(jù)《紙質(zhì)檔案數(shù)字化規(guī)范》的基本條件,我們采用了像素分辨率為300DPI的負(fù)片掃描儀和原始掃描方式,制作了文字識別合成一個雙層PDF。這些索引完全適合檔案的存取和利用,也有利于后期的檢索系統(tǒng)。此外,他們基本上保證了檔案的模擬復(fù)制和展示。
生產(chǎn)要求。值得一提的是,檔案目錄數(shù)據(jù)庫系統(tǒng)的建立必須與省檔案館開始實施的《文書檔案目錄數(shù)據(jù)采集規(guī)范》中規(guī)定的字段和字段值保持一致,有利于下一步目錄數(shù)據(jù)的在線訪問和全省檔案目錄數(shù)據(jù)的統(tǒng)一。
(二)加工場所的監(jiān)督和指導(dǎo)
國家檔案館(室)應(yīng)指定一名負(fù)責(zé)人負(fù)責(zé)處理地各部門的溝通、指導(dǎo)和監(jiān)督,建立問題反映機(jī)制,對處理模式中遇到的問題及時給予反饋和糾正,積極總結(jié)、指導(dǎo)類似問題,減少重復(fù)勞動,確保數(shù)字檔案全過程的安全、進(jìn)度和質(zhì)量。
1.預(yù)掃描采集注意事項
排版問題。國家檔案館館藏有大量解放后的舊檔案。這些檔案環(huán)境復(fù)雜,紙質(zhì)差,掃描處理費時。有些文件是垂直排版的,從左到右,從上到下。不同的排版方法出現(xiàn)在同一個文件中。如果前整理者不注意,很容易造成掃描順序前后混亂。這就要求在掃描前和掃描過程中要強(qiáng)調(diào)這個問題,以免掃描順序混亂。
2.分段問題。主要是指涉及到很多名字的民生檔案,比如干部職工的分配函。這類檔案每年會有2-3卷,每卷100-200頁,每一頁都涉及一個人的分配和移交。這類文件建議一人一份或10人一份,記錄文件標(biāo)題時要顯示每個人的姓名。基本上檔案管理軟件的檢索功能并不完善,即使有檢索功能,對筆跡的識別準(zhǔn)確率也很低。因此,仍然需要在目錄的標(biāo)題中清楚地顯示出來,或者設(shè)置一個專門的名稱目錄,這樣可以方便檢索,提高檢索效率。此外,教育局的本科生整理工作分配表、知青信息采集表等多種姓名的檔案,如何記錄便于檢索,是否設(shè)置專門的姓名目錄或以標(biāo)題或備注等方式展示。,也值得討論。
3.專業(yè)檔案單獨處理問題。市級檔案館(室)一般保存較多文書檔案,但也有不少與民生相關(guān)的專業(yè)檔案館,如學(xué)籍檔案、婚姻檔案館、土地延伸檔案館等。這些專業(yè)檔案的分類和目錄信息與文書檔案不同。比如學(xué)籍檔案一般按照高校檔案的分類標(biāo)準(zhǔn)進(jìn)行分類,這與文書檔案的機(jī)構(gòu)(問題)在檔案號編制上的分類不同。如果文件號編譯規(guī)則為文書檔案"全宗號。-目錄號。-案件號。-PartNo。”都使用了,混淆在一起會很容易導(dǎo)致文件編號編譯。對于目錄信息,婚姻檔案目錄應(yīng)設(shè)置姓名、婚前日期、籍貫等字段。土地擴(kuò)展包的檔案是按照鄉(xiāng)鎮(zhèn)、行政村和戶主的名字排列的,這些信息需要在目錄字段中設(shè)置。因此,專業(yè)文件需要在文件系統(tǒng)中設(shè)置不同的節(jié)點,并根據(jù)需要設(shè)置目錄字段,以便更有效地顯示所需信息。
(三)掃描圖像處理問題
一般需要旋轉(zhuǎn)、糾偏、去污、切割掃描過程。但是,對于一些特殊尺寸的文件,我不建議剪切。例如,工作分配和就業(yè)協(xié)議或戶籍證明的存根大小為64。掃描時建議按照A4掃描,切白邊時不建議切掉,因為切白邊后的圖像會放大,印章也會隨之放大,作為證書打印時會略有失真,不利于與原印章對比,有些人會擔(dān)心作為證書。
(四)字體識別問題
難認(rèn)的字大多是手寫的,或者寫得太差認(rèn)不出來,或者是簡體字或者是非標(biāo)準(zhǔn)異體字。一般要根據(jù)語義的意思進(jìn)行驗證。比如當(dāng)時字典里沒有“威”字,搜狗輸入法里也沒有“威”字,但它是一個電子文檔。按照語義,應(yīng)該是代表電的力量的單位。考慮到“kW”的換算關(guān)系,結(jié)合上下文,確定為“kW”。還有,“羅”“漢”“謝”是不規(guī)范的正字法文字,需要經(jīng)歷過文字改革過程的人進(jìn)行識別和確認(rèn),才能使文書的標(biāo)題完整準(zhǔn)確。*難確定的是學(xué)籍檔案中的姓名、干部職工的證明信等與姓名相關(guān)的檔案,一般只出現(xiàn)一次,通篇沒有語義參照。為了識別一個字,有些人需要查閱一些家譜,從幾代姓氏中確定名字中的字,有時還需要請檔案形成單位的老工人,使作為主要檢索線索的檔案標(biāo)題盡可能完整準(zhǔn)確,提高目錄描述質(zhì)量。
數(shù)據(jù)接收量存在的問題
項目驗收涉及真實可靠、及時性、可及性和可靠性、掃描數(shù)據(jù)與目錄一一對應(yīng)、目錄描述是否規(guī)范、是否有利于檢索利用等。在數(shù)據(jù)驗收這個環(huán)節(jié),既要保證數(shù)量與檔案信息的對應(yīng),又要保證數(shù)據(jù)的完整性和質(zhì)量符合規(guī)定。
范,終于方便使用了。我們的做法是在數(shù)據(jù)的實地驗收上采取監(jiān)督機(jī)制,先由監(jiān)理公司對數(shù)據(jù)進(jìn)行100%的檢查驗收,再由市檔案館對監(jiān)理公司提交的數(shù)據(jù)進(jìn)行抽查,抽查比例為10%。如果發(fā)現(xiàn)超過3%的錯誤,監(jiān)理公司會重新接受并修改數(shù)據(jù)。
經(jīng)過兩次驗收,在使用過程中會發(fā)現(xiàn)一些小問題。較大的有自制標(biāo)題、拼錯的字符和單詞識別問題。從這些問題來看,我們認(rèn)為在驗收中,除了抽查之外,還要重點抽查可能出錯的數(shù)據(jù)。反饋問題的結(jié)果,從而避免錯誤的發(fā)生。數(shù)字檔案館(室)建設(shè)是不斷擰動檔案數(shù)字化水平,實現(xiàn)檔案電子書集中統(tǒng)一管理,推進(jìn)檔案信息共享工作,充分挖掘檔案價值,讓檔案服務(wù)政府、服務(wù)公眾、服務(wù)群眾的必要手段。是基礎(chǔ)支撐工作,是搶抓檔案信息化建設(shè)蓬勃發(fā)展、發(fā)揚光大的難得機(jī)遇工匠精神
智能密集架:
智能密集架由底盤和導(dǎo)向方鋼組成的地軌組成,根據(jù)安裝空間的使用情況可分為面式、嵌入式和加強(qiáng)橋式。
底盤采用大梁等薄鋼板、橫檔、柱座等。并且是具有良好剛性的不可拆卸結(jié)構(gòu)。
框架由立柱、隔板、面板、掛板、頂板等組成。為插入式軟鉚釘鉚接結(jié)構(gòu),可拆卸。
聯(lián)動裝置由手柄鏈、電機(jī)、減速器、電磁離合器、后輪軸、鐵輪等組成。
檔案密集柜手動:手柄-z2鏈輪-z48、Z13雙鏈輪-前軸鏈輪驅(qū)動軸旋轉(zhuǎn)-兩個滾軸鏈輪-滾軸旋轉(zhuǎn)-滾軸驅(qū)動四個滾軸同步旋轉(zhuǎn)-集中柜移動。在手動操作中,電磁離合器電源關(guān)閉并斷開,換檔鏈輪空轉(zhuǎn)。
電動,電腦控正時:電機(jī)-減速器-齒輪-半軸中間鏈輪-驅(qū)動軸轉(zhuǎn)動-兩個輥軸鏈輪-輥軸轉(zhuǎn)動-輥軸帶動四個輥同步轉(zhuǎn)動-密集柜移動,此時手柄(除手柄外)與驅(qū)動軸之間的所有密封使工作保障人員。
電動檔案密集柜結(jié)構(gòu)由控制部分和機(jī)械部分組成。
控制和機(jī)械的主要部分分為:
1、驅(qū)動:臺式電腦、液晶顯示器、軟件、連接線、控制主板、控制板、電機(jī)板、按鍵板、通訊板、紅外板。
2、機(jī)械機(jī)構(gòu):地軌、底盤、車架、變速箱。