摘 要:針對勘察設(shè)計企業(yè)的數(shù)字檔案館建設(shè)技術(shù),提出從基礎(chǔ)設(shè)施層、數(shù)據(jù)層和應(yīng)用層進行整體架構(gòu)設(shè)計,并完善相應(yīng)的規(guī)范保障體系。通過應(yīng)用OCR技術(shù)實現(xiàn)歷史存量紙質(zhì)檔案的數(shù)字化,從而將歷史檔案盤活。根據(jù)OAIS參考模型定義的業(yè)務(wù)實體和功能實體,圍繞檔案生產(chǎn)者、消費者和管理者構(gòu)造檔案存儲體系,并實現(xiàn)業(yè)務(wù)系統(tǒng)電子文件在線歸檔至檔案系統(tǒng)。最后對數(shù)字檔案館的基礎(chǔ)建設(shè)、進階管理以及知識挖掘三個建設(shè)階段進行了探討與分析。
關(guān)鍵詞:勘察設(shè)計企業(yè);數(shù)字檔案館;數(shù)字資源;檔案系統(tǒng)

0 引言
企業(yè)檔案是指企業(yè)在生產(chǎn)經(jīng)營管理活動中形成的對國家、社會和企業(yè)有保存價值的各種形式的文件材料。隨著企業(yè)規(guī)模以及經(jīng)營業(yè)務(wù)的不斷發(fā)展壯大,企業(yè)各種類型檔案如工程項目檔案、財務(wù)檔案、科技檔案會越來越多。這些檔案是企業(yè)知識與經(jīng)驗的傳承,見證了企業(yè)的成長,是企業(yè)寶貴的財富。
勘察設(shè)計行業(yè)作為典型的知識密集型行業(yè),其工程項目具有較高的技術(shù)含量。檔案作為工程項目知識的積累與沉淀,具有較高的利用價值。但現(xiàn)狀是勘察設(shè)計企業(yè)經(jīng)營者往往只重視項目的經(jīng)營管理與技術(shù)質(zhì)量管理,卻忽視了最后的設(shè)計成果歸檔環(huán)節(jié)。雖然在工程項目開展過程中應(yīng)用了較為先進的設(shè)計軟件、項目管理系統(tǒng),但項目檔案的歸檔依舊采用較為落后的方式,導(dǎo)致檔案管理和利用效率較低,信息資源開發(fā)嚴重不足,無法滿足企業(yè)生產(chǎn)經(jīng)營、知識利用和倡議決策的需求。因此,建設(shè)數(shù)字檔案館,利用信息化手段大幅度提升檔案管理的效率和質(zhì)量,發(fā)掘企業(yè)的隱含知識,是勘察設(shè)計企業(yè)知識化管理的重要途徑。
1 勘察設(shè)計企業(yè)檔案管理問題分析
1.1 歷史檔案數(shù)量大,難以管理
大型勘察設(shè)計企業(yè)往往歷史較為悠久,館藏檔案數(shù)量巨大。受制于以往信息技術(shù)發(fā)展水平的限制,勘察設(shè)計企業(yè)存量檔案中紙質(zhì)檔案占絕大多數(shù)。由于紙張在長期保管、利用過程中會因各種因素影響而不斷老化、變質(zhì)、易損壞,一旦管理不善,會使眾多的歷史檔案失去珍藏和利用價值,增加了企業(yè)的管理成本。
1.2 項目周期長,變更頻繁
勘察設(shè)計項目的周期通常比較長,其中涉及的專業(yè)也比較多,而在設(shè)計過程中往往會因為工程建設(shè)條件、外部環(huán)境以及工程實施過程中各參建方的主觀意見等因素導(dǎo)致設(shè)計變更。由于傳統(tǒng)的檔案管理系統(tǒng)缺乏與其他業(yè)務(wù)系統(tǒng)數(shù)據(jù)聯(lián)動、在線歸檔的技術(shù)支持,勘察設(shè)計項目負責人很難將項目的完整材料進行整理歸檔,項目檔案容易缺失。
1.3 設(shè)計文件缺乏統(tǒng)一歸檔規(guī)范
勘察設(shè)計項目傳統(tǒng)的設(shè)計出圖過程,是各專業(yè)設(shè)計人員使用各自的繪圖軟件繪制工程圖紙,再由校審人員審批形成最終成果。但由于設(shè)計制圖軟件版本眾多,且缺乏與檔案系統(tǒng)的有效連接,導(dǎo)致勘察項目的各類設(shè)計文件存在大量不規(guī)范、不統(tǒng)一的問題,增加了檔案管理、利用的難度。
1.4 知識利用率低
傳統(tǒng)檔案管理模式下,往往以工程項目為歸檔單元進行檔案搜集。雖然方便了項目檔案的管理工作,但由于檔案館員往往不具備勘察設(shè)計專業(yè)知識,缺乏對檔案知識標簽的梳理,因此難以形成較為完善的知識圖譜,檔案利用價值較低,項目經(jīng)驗難以復(fù)用。
2 數(shù)字檔案館建設(shè)整體架構(gòu)
如圖1所示,為解決勘察設(shè)計企業(yè)檔案管理存在的問題,數(shù)字檔案館的建設(shè)應(yīng)涵蓋基礎(chǔ)設(shè)施層、數(shù)據(jù)層和應(yīng)用層,并完善相應(yīng)的標準規(guī)范體系和安全保障體系。
2.1 基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層應(yīng)包含支撐數(shù)字檔案館運行的中心機房、網(wǎng)絡(luò)平臺、服務(wù)器、存儲設(shè)備、終端設(shè)備及其他軟硬件設(shè)備。有條件的企業(yè)可以同時配合搭建智能檔案庫房,通過智能化控制,實現(xiàn)對實體檔案的無序存放、有序管理。
2.2 數(shù)據(jù)層
數(shù)據(jù)層包含檔案資源數(shù)據(jù)庫,以及編研形成的各項專題數(shù)據(jù)庫。該層的設(shè)計應(yīng)以檔案資源的高效管理和利用為導(dǎo)向,搭建以NoSQL為基礎(chǔ)的分布式檔案存儲系統(tǒng)。通過對檔案元數(shù)據(jù)、數(shù)據(jù)分布、數(shù)據(jù)采集以及知識標簽的梳理,構(gòu)建項目檔案的知識圖譜,為檔案知識化應(yīng)用提供數(shù)據(jù)支撐。
2.3 應(yīng)用層
應(yīng)用層應(yīng)在數(shù)據(jù)層的基礎(chǔ)上,建設(shè)實現(xiàn)勘察設(shè)計項目全生命周期管理的數(shù)字檔案系統(tǒng)。利用微服務(wù)+Docker容器化技術(shù)實現(xiàn)檔案收集、整理、保存等功能,并同智能庫房連通,實現(xiàn)電子檔案與實物檔案的一體化管理。
2.4 標準規(guī)范體系與安全保障體系
數(shù)字檔案館的建設(shè)離不開相應(yīng)的規(guī)范體系支撐,應(yīng)制定包含檔案收集、整理、保管、利用等方面的標準規(guī)范體系及實施要求。同時還要建立健全基礎(chǔ)設(shè)施、軟件系統(tǒng)、網(wǎng)絡(luò)等方面的安全保障體系以及企業(yè)保密管理條例。
3 關(guān)鍵技術(shù)
3.1 數(shù)字資源建設(shè)
數(shù)字資源建設(shè)應(yīng)從兩個方面入手:一是要實現(xiàn)歷史存量紙質(zhì)檔案的數(shù)字化;二是要實現(xiàn)增量電子檔案的移交入庫。為了將歷史檔案盤活,檔案的數(shù)字化不能僅僅是完成掃描工作,還需要借助OCR技術(shù)獲得可檢索的數(shù)字化副本。這個過程需要對圖紙內(nèi)容進行識別、標引、入庫等電子化加工,并對圖紙中圖像進行建庫檢索、智能差異比對、版面還原,再配合索引數(shù)據(jù)庫、全文檢索等技術(shù)構(gòu)建圖文檢索管理系統(tǒng),實現(xiàn)數(shù)字資源的高效利用。
3.2 數(shù)字檔案系統(tǒng)建設(shè)
如圖3所示,數(shù)字檔案系統(tǒng)的建設(shè)應(yīng)根據(jù)OAIS參考模型定義的業(yè)務(wù)實體和功能實體,圍繞檔案生產(chǎn)者、消費者和管理者構(gòu)造檔案存儲體系。其中生產(chǎn)者和消費者是指提供檔案和利用檔案的個人或組織。如項目檔案的生產(chǎn)者是承擔工程項目的各項目組,項目檔案的消費者為其他需要借鑒學習的項目組或新入職的員工。管理者通常作為檔案管理機構(gòu),負責制定檔案歸檔范圍、歸檔流程等標準體系。數(shù)字檔案系統(tǒng)應(yīng)圍繞這三個業(yè)務(wù)實體定義檔案收集、數(shù)據(jù)管理、檔案存儲、檔案利用、保存規(guī)劃、系統(tǒng)管理6個功能實體來完成整個檔案管理流程。
推薦閱讀:檔案管理方面的著作怎么出版
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >