2016年4月7日,國家檔案館發布《全國檔案事業發展“十三五”規劃綱要》,在《綱要》中提出“積極推進數字檔案館建設”“完善檔案客戶信息化和信息資源深度研發和整體服務”“探索電子檔案與人工智能行動融合”,為新時代檔案事業發展提供以下新思路:
在互聯網大數據必然成為時代步伐的背景下,我們要探索屬于自己的云計算——歸檔大數據;(2)數字檔案館建設不僅追求傳統檔案館大數據資源的數字化時代,還需要進一步實現大數據化;(3)在檔案大數據環境下,推動信息資源的延伸開發和整體服務,是數字檔案發展的新趨勢。筆者認為,將檔案大數據資源轉化為檔案知識資源,為用戶提供文化服務,是數據資源發展的一個方向。
本文對省人民政府檔案門戶網站進行了在線調查,了解了數字檔案館提供知識的現狀,提出了檔案互聯網大數據下數字檔案館提供知識的建議,希望在自學的同時,對數字檔案館知識平臺的實踐起到參考作用。
互聯網大數據和文件云計算。
2014年,大數據云計算首次在政府工作報告中作為一個概念提出。2015年,國務院發布《促進大數據發展戰略》,正式拉開了我國大數據實驗室和發展的大幕。
隨著大數據時代的到來,各行各業都在向信息化層面發展,檔案行業也不例外。
檔案互聯網大數據是檔案大數據的云計算。筆者認為,包括大數據在內的檔案是檔案產業的進步和創新,二者是一脈相承、密切相關的。
首先,分布式存儲、文本挖掘、數據挖掘和數據集成等許多數據分析技術將廣泛應用于檔案和大數據。
檔案機構的數據模型要作為互聯網大數據的一個子項納入,否則用大數據是不完整的。
兩者*大的區別在于檔案互聯網的大數據是歷史數據,而人工智能是基于各種數據,這就延伸了管理技術和預測系統性能的差異。
但不可否認的是,在當今大檔案觀的影響下,檔案大數據云計算越來越重視實時數據,基本實現了預測的功能。
2.檔案、互聯網、大數據下的數字檔案館知識平臺是什么?在檔案大數據時代中,概念的內涵發生了變化。因此,基于對秦曉珠等學者提出的“大數據云計算的知識平臺”的理解、維基百科的定義以及大數據與檔案云計算的區別,筆者認為檔案互聯網大數據下數字檔案館提供的知識是:在數字檔案館中,用戶需求是中心,檔案還原服務是主要目的。為適應未來檔案服務智能化、個性化、定位化的趨勢,衍生出基于互聯網的數字檔案多維度多模式處理的新信息服務模式,旨在為檔案用戶解決難題。
首先,加強對知識挖掘等技術和經驗的要求。
互聯網大數據下的數字檔案館知識產品基于高端信息產業、知識挖掘、知識存儲分析等技術,其中知識挖掘*為關鍵。
面對海量異構的紙質檔案資源,利用大數據技術,將分布在相關數據庫多源異構源中的數據(如關系數據、平面數據文件等)提取到臨時內層進行判別、清洗、轉換和整合,*后加載到分布式架構中,再對知識庫進行全面挖掘、集成和提煉、分析和比較,并通過智能聚類和關聯分析方法進行深度開發和利用,從而將隱性教育隱性化,將挖掘所需的知識提供給用戶,這與傳統的知識供給有很大不同。
數字檔案館的知識產品與傳統檔案館云計算下的知識提供的主要區別在于是否挖掘數據。傳統形式的知識平臺,提供簡單使用、文件編譯研究、文件發布等。,是基于數字文件或尚未轉換為數字文件的原始文件。用戶發出需求后,需要花費過多的額外工作,讀取完整的文件并反饋給用戶。
檔案云計算下數字檔案館提供的知識應該具有數據價值。在提供知識產品的前期,需要克服*困難的工作,完成知識庫建設等準備工作。之后,檔案企業乃至用戶自身都可以快速高效地滿足信息需求。
*后是個性化、導向化、定制化的服務。
在檔案大數據時代中,數字檔案專業人員不再只是被動地根據用戶解決問題,而是近乎提供全方位、定向性、定制化的服務。
大數據利用數據挖掘技術,對用戶的文件需求和利用行為進行分析,找出需求方向和趨勢,并根據用戶的實際或潛在需求提供給不同層次的用戶。
數字檔案館知識產品的現狀和問題
1.確實是目前的情況。為了解目前數字檔案館的知識平臺水平,筆者調查了全國34個省級信息門戶網站,調查了網站上是否有“數字檔案館”登記門戶和已有的知識服務,通過詢問檔案工作者對數字檔案館知識產品的推廣情況,大致掌握了今年我國數字檔案館知識產品的主要情況。
在全國34家省級檔案互聯網網站中,僅有6家網站設有數字檔案欄目,并提供單獨的檢索平臺,可通過熱門關鍵詞和標題進行普通或高級檢索(圖
有無“數字檔案”標志的數量比例
(2)傳統知識提供,如成果匯編、業務辦理服務、城市記憶等。,被省級國家檔案館廣泛開展。
個別國家檔案館比較新穎,如上海市檔案館推出的檔案百科、檔案論壇;江蘇、湖北、甘肅和內蒙古檔案館推出的在線課堂和教育企業;遼寧檔案館社交檔案管理員,即讓用戶在線編輯條目,這些條目被批準并顯示在網頁上;寧夏檔案館檔案知識的整合。
(3)在咨詢留言中,通過兩個工作日內的7次回復,了解到如今的數字檔案館基本沒有可進行大規模運營的知識產品,數字化技術主要以目錄的形式出現,全文很少,數字化時代率普遍較低。
(4)包括省級市級檔案,如普洱市專題數據庫、浙江省網上展覽。它具有數字檔案提供知識的雛形,但不是基于檔案大數據系統。
數字檔案館知識資源不足。
知識是提供知識的基礎。與傳統知識獲取資源中“數據-信息-知識”的金字塔模型相比,大數據時代數據不再基于DIKW金字塔模型,而是轉化為知識甚至智慧。因此,大數據時代要想掌握知識資源,必須掌握數據資源。但目前,數字檔案很難形成集群數據資源。
數字檔案館的技術水平難以滿足檔案大數據云計算的要求。它是技術數字檔案館知識平臺的前提。只有技術可靠,知識平臺才能實現。
數字檔案館一般不引入數據算法等數據技術,大多數數據庫系統使用關系型數據庫,這使得存儲海量數據資源數據不方便。
升級水平低,尤其是民國時期的數字掃描過程,只能簡單地掃描成圖片。
由于缺乏技術,提供知識滯后。數字檔案館網站尚不完善。
首先,調查顯示,在全國34個省級檔案門戶網站中,只有6個擁有數字檢索平臺,其中包括上海和浙江等國家示范數字檔案館尚未完成的遠程檢索文件。
這說明數字檔案館建成并通過國家評估后,只在內網或專網運行,公眾無法通過檔案門戶遠程使用。
其次,部分城市檔案網站在使用中存在用戶注冊繁瑣、版塊缺失、鏈接無效、輔導流程復雜等問題。
這將挫傷用戶的知識平臺,充分調動利用請求。
從公眾的訪問量和留言量來看,檔案互聯網網站的使用率較低。
效率低、效益差影響了信息工作者的充分調動,專業人員在實際工作中很難發現難題,導致缺乏獨到的思路和解決方案。
檔案大數據云計算、數字檔案提供知識的問題及原因
知識資源不足。數字檔案館知識資源的匱乏本質上是數據資源的匱乏。
首先,數字檔案館的數字化技術水平較低。
調查顯示,部分市級數字檔案館的互聯網滲透率不高,比如四川省的數字化時代率只有30%左右。數字化檔案以目錄信息為主,全文信息較少。
全文數字化時代的難點主要是民國檔案。
由于民國檔案歷史悠久,很多都存在紙張皺巴巴、字跡褪色等問題。部分文件排列混亂,文件和字符無法識別,數字化改造難度極大。
數字化程度低,缺乏全文數字化轉化,直接導致數字檔案的不完整。
其次,檔案數字化信息化不是數據驅動的。
全文數字化時代,檔案大數據資源的成果主要是圖片和PDF,很少有對數字系統的標準化描述和標引。
檔案的內容、特征等信息無法合理描述和分析,檔案全文無法通過關鍵詞檢索,必然增加數字檔案的入門難度,數字檔案只會是利用率的數字而不是數據。知識平臺以數字檔案為基礎是不現實的。
*后,數據資源側重于動態數據很少的數據模型。
由于檔案本身的相對記錄,檔案的歸檔以非當前檔案為基礎,導致歸檔數據的滯后性。
一方面,這不會為解決用戶的學習需求提供完美的數據;另一方面,當前記錄的缺乏會使紙質文件在知識平臺中變窄。只有將現有記錄與數據模型有機結合,才能發揮完整數字檔案的作用,這也是基于檔案云計算和大檔案觀的設想。
它的技術比較低。目前該技術存在很多不足,以下兩點是典型的例子來說明。關系型數據庫廣泛應用于數字檔案館。
不可否認,在信息化工作之初,數據存儲容量較小的復雜數據關系型數據庫可以更好地進行管理和存儲,但如今,隨著信息技術的發展,電子檔案和歸檔數據日益增多,關系型數據庫并不能基本滿足存儲這些文本數據和信息的要求。
目前常見的做法是將復雜數據轉換為非結構化數據,然后使用關系型數據庫,但這樣會造成不可靠的數據冗余。
鑒于關系型數據庫存儲海量非結構化數據的缺陷和非關系型數據庫在這方面的優勢,檔案機構有必要引入非關系型數據庫技術,對即將接收或數字化的文本數據數據資源進行有效存儲、管理和利用。
文本挖掘等云計算等技術尚未普及。
未來,信息化工作的主要作用不再是前期的安排和維護,服務的提供也不再是簡單的參考。相反,有價值的文件應該被迅速挖掘出來,并在眾多的數字檔案中提供給用戶。
通過數據建模等云計算技術,可以合理利用數字檔案,信息工作者大大優化日常處理,提高工作效率。
公眾對檔案的觀念淡薄,目標用戶數量相對較多。由于公眾對檔案輿論的無知和宣傳不充分,有些人對檔案沒有一個基本的認識,只是主觀地假設檔案是否應該存在。
或者對檔案的理解過于片面,認為檔案只能在工作中使用。檔案的這些認知錯誤使得檔案潛在的活躍用戶減少。
用戶信息需求無法滿足,實際用戶數量減少。用戶登錄檔案網站或向人員提出信息要求后,如果達不到要求,就會對檔案信息化失望,再次使用會有困難。
目前,數字檔案館普遍缺乏面向公眾的一站式檢索平臺,用戶無法遠程檢索。如果去他們的檔案室,會很不方便,通過咨詢了解功能向專業人士咨詢信息可能會出現一系列問題。
用戶使用不方便,需求得不到滿足,減少了活躍用戶數量。
檔案、互聯網和大數據下的數字檔案館知識產品建議構建大數據云計算知識資源數據庫。
首先,數字時代不是大數據時代。
數據資源是知識資源的前提和基礎,圖書館檔案要先數字化才能成為數據資源。
這些分散、異構的數字檔案經過網絡化后,經過標準化的描述和標引,進行組織和建設,成為數字檔案,這是包括大數據知識資源庫在內的數字檔案建設的前期準備階段。
其次,處理海量檔案數據。
需要通過數據清洗、整合、轉換等方法,剔除不完整、重復、有噪聲、不相關的數據,并對數據進行審核、篩選、排序,以便后期進一步的數據提取。
前期工作處理不僅是對數字檔案館中的檔案進行整理,也是對知識資源庫的加強。
然后,形成知識資源庫模塊。
大數據處理的檔案是孤立分散的人工處理數據,不能反映數字檔案資源的全貌。
數字檔案館應采用大數據平臺技術,將各種分散、異構的不同來源的數字檔案導入大型分布式計算或存儲集群,形成全息化、智能化的檔案大數據云計算知識資源數據庫模塊。
例如,全息檔案的建立包括大數據知識資源數據庫、面向檔案信息化和檔案用戶的知識資源子數據庫、面向開放檔案和保密檔案的知識資源子數據庫。
*后,重新處理歸檔大數據維度。
使用信息可視化通過表格、模型、圖形等顯示數據。,比單純使用數字和文本更容易被用戶理解和接受。
利用語義垂直搜索,通過搜索匹配、關聯推理和語義理解,可以達到對用戶信息需求進行語義分析的目的,從而全面篩選用戶需要的關鍵詞搜索,達到精準搜索的目的,增加知識利用水平;利用趨勢預測分析,利用統計、建模和數據算法等工具,對已達到的數據進行研究,完成預測,充分發揮包括大數據在內的檔案預測系統功能。
構建數字檔案館知識產品的主要網絡系統。
歸檔云計算下的數字檔案館中的數據是歷史冷數據,但歸檔人工智能傾向于重視實時數據,以往歸檔方式的整體呈現具有時效性。
實時存檔平臺基于存檔云計算和云計算技術,收集分散在網絡上的信息和數字化過程中產生的電子檔案。通過類似智能AI輔助識別的智能識別,過濾低價值、錯誤的數據,對過濾后的數據進一步整合處理,缺乏系統性和全面性數據資源,使得知識平臺在檔案大數據云計算下預測技術功能成為可能。
目前,部分數字檔案館已經完成了信息服務平臺的初步建設,可以通過方法實現檔案資源的查詢、檢索和利用。而檔案人工智能的知識產品要求很好地實現知識發布、共享、私人定制和用戶分類分析。首先,信息服務平臺應該是發布知識產品的“一站式”平臺,包括滿足消費者的學習需求,為用戶提供私人定制服務。
其次,信息服務平臺要有知識共享模塊。通過檔案工作者、專家、信息工作者和專業用戶之間的知識共享,將個人學到的隱性知識轉化為顯性常識和表達情感,既能滿足房管系統的信息需求,又能提高知識資源庫的學習積累。
*后,信息服務平臺要注重用戶信息和反饋的科學分析處理。通過反饋和評價,可以充分了解自己的整體知識服務水平和用戶需求,有利于形成個性化、導向化、定制化的知識產品。
以知識眾包平臺為基礎,與用戶共享數字檔案館中的部分檔案,如檢索用的科學描述和索引、抄錄歷史資料和民國檔案供使用、上傳共享與某一主題相關的檔案和反映生活發展的重要檔案等。,從而形成面向用戶的知識服務和面向用戶的知識情境。
加快數字化和歸檔進程,彌補信息工作者數量缺陷導致的數字化程度低。
知識眾包平臺本質上是一種知識服務共享。文件用戶在參與眾包活動時分享自己的理解。思維與知識的這種碰撞有助于創新意義理念的產生。
同時,知識眾包平臺可以提高檔案的媒體影響力,是檔案進入公眾視野的絕佳方式,讓公眾自愿、自動地認識檔案、關注檔案、加入檔案的主動維護,有效增加真實用戶和目標用戶數量。
綜上所述,雖然我國數字檔案館提供的知識必然會成為信息服務發展機制的趨勢之一,但行業發展能力不足,是因為沒有跟上檔案大數據云計算的趨勢。檔案云計算為數字檔案知識平臺的發展提供了新的機遇。進入行業新時代,要抓住機遇,把握大勢,將檔案數據技術融入提供知識中,讓數字檔案館真正成為公共服務的檔案館。
庫房綜合智能
管理系統
本系統嚴格按照“嚴格、合理、可靠、經濟、完善”和“無人值班、少人值守”的要求進行設計,具體原則如下:
? 系統選型高起點:
★ 技術**性:選用新的專業技術與產品;
★ 系統高可靠性:系統的硬件和軟件均采用技術成熟的產品,平均無故障時間均在20萬小時以上;
★ 系統運行管理方便:軟件系統中文化,操作方便;
★ 設計架構**:系統采用真正的B/S+C/S架構,業內唯一全程WEB支持的監控平臺
★ 技術支持能力強:承建單位技術實力強,服務完善;
★ 系統集成度高:系統完美整合了設備實時監控、運行狀態、數據查詢、深度分析、信息告警等等;
★ 系統交互性好:用戶可通過PC及移動終端實時查詢系統設備的各種參數與狀態,掌握主動權;
★ 系統可擴展性能強:模塊化結構有利于擴容與擴展。
★ 高可靠性保證:系統支持雙機/多機熱備方案,特殊應用沒有后顧之憂;
? 投資少: 系統選型具有高性能價格比。
? 建設時間短:在較短的時間內完成系統的安裝調試。
? 優質的服務:本著“用戶**、服務至上”的原則。
庫房恒溫恒濕智能控制系統:
★ 溫濕度:監測檔案庫房內重要區域的溫度、濕度數值及變化情況。
★ 空調: 監測空調的運行狀態,并可實現遠程開關機啟停控制模式并調節溫度閾值及聯動等。
★ 除濕加濕一體機: 自動設定一體機濕度,并對一體機運行狀態及內部模塊實時監測。
庫房自動防火防盜報警系統:
★ 門禁管理: 采用進門人臉識別+掌紋識別+刷卡+出門按按鈕的驗證方式,實現對人員出入情況的管理。
★ 視頻圖像: 監視庫房的實時圖像,并進行視頻錄像。
★ 防盜: 紅外探測器,監測檔案庫房人員活動情況。
★ 防火: 煙霧報警測器,監測檔案庫房內的火警情況。
庫房自動消毒滅菌系統:
★ 臭氧消毒機 監測臭氧消毒機的運行狀態及參數,并可實現遠程開關機啟停控制。
庫房環境監測系統:
★ 漏水監測: 區域式漏水, 米漏水感應繩,監測庫房內除濕一體機以及墻壁四周有無漏水發生。
★ 毒害氣體: 監測庫房內部氣體是否毒氣及空氣質量是否超標,并聯動消毒機進行空氣消毒。