第一, 非數字格式的檔案還處于數字化的進程中, 當前各國的檔案數字化完成度有待提升。由于數字化涉及計劃、檔案選擇、掃描、著錄等一系列流程, 當前有限的人力和財力使得數字化處于較緩慢的進程中。例如, 美國檔案與文件署保管了125億頁的文件, 但得到數字化的不過2.35億頁。
第二, 由于多數檔案僅能通過目錄檢索以線上申請結合人工審核的方式獲取, 這使得檔案難以實時獲取且可能需要若干工作日的等待, 甚至當前多數檔案機構并未提供針對用戶在線申請的檔案服務, 用戶仍然需要線下實地申請。
第三, 網站的在線檢索不盡完善, 一方面在于數字化的檔案未能充分數據化或原生數字檔案的異構化, 信息組織深度不足, 檔案不能完成數據層面的自定義, 檔案之間難以互聯互通, 未能達到機器學習的要求, 從而難以高效提供精確的檔案滿足用戶需求。另一方面, 網站未能提供全面的在線專業指導或輔助, 用戶在檢索中遇到的問題難以及時解決。例如, 我國當前的檔案網站并未實現全文檢索, 對所需檔案了解有限的用戶檢索策略難以與檔案網站提供目錄、主題詞或關鍵詞匹配。
第四, 數字化檔案與原生數字檔案均存在智能開放問題, 即技術上能夠實現在線檢索卻限于保障檔案利益相關者的權益所需面臨開放上的問題。例如, 開放哪些檔案、開放檔案中的哪部分內容、對誰開放, 合適開放是精細化的工作, 亦需要更加嚴密的規則支持, 在目前更多地依賴人工審查的狀況下開放受限, 未能充分應用技術也導致開放存在一定問題。
本文地址:http://knowyourextract.com//article/8915.html