從國內外網頁檔案長期保存的項目來看,其多為公益性項目,同時大部分的項目都是在政府部門的支持下由多個部門聯合參與或者舉辦的,如國家檔案館、高校、網絡中心或者信息中心、商業部門和公益性機構。如澳大利亞的數字檔案PANDORA項目和我國的“中國Web信息博物館”項目,都是由圖書館、檔案館和高校聯合參與的。基于網頁采集的動態變化性和多樣性等特點,僅有檔案館或者圖書館單獨承擔這類大項目是不現實的,因此必須鼓勵多方力量共同參與到網頁長期保存中。具體來說,就是要做好職能劃分和利益分配的工作。首先,參與單位可以在法律允許的范圍內對網頁檔案信息資源進行合理的利用,如圖書館和檔案館可以利用網頁資源進行檔案服務的深度開發與加工。其次,網頁檔案采集工作對技術的依賴性較高,因此還要支持和鼓勵互聯網企業或者信息技術企業參與到項目中,為采集項目提供技術上的支持。最后,還要不斷豐富采集項目的資金來源,利用項目眾籌和社會募捐等非政府撥款方式募集資金,為采集項目提供更多的資金支持。
當前網頁檔案信息的主要采集策略有兩種,分別是完全性采集策略和部分性采集策略。完全性收集策略是指對網頁的所有信息進行收集。目前,瑞典、奧地利和美國的多個網頁檔案保存項目采用了完全性采集策略。完全性采集策略的優勢在于不需要人工對網頁內容進行判斷和復制,而是完全由機器完成這一操作,因此其成本較低。對于小型的、資金較為缺乏的檔案管理部門,可適當地選擇完全性收集策略,但需要注意對信息進行過濾。內容結構和類型較為單一的網站可通過設置關鍵詞對無用信息進行過濾,同時建立定期的人工審核機制。
部分性采集策略是指有選擇地對網頁的某個類型或者學科的內容進行收集,因此其內容的專業性較強,主題也十分鮮明。與完全性采集策略不同的是,部分性采集以價值判斷為基礎,通過制定完善的采集標準限定采集的內容,因此標準是否合理就成為部分性采集是否成功的決定性因素。對此,檔案管理部門在選擇部分性采集策略時,應充分考慮到網頁檔案信息的動態變化性,對網頁信息實行動態監控,并及時調整采集策略,不斷提高網頁采集的覆蓋率。
本文題目:網頁檔案信息長期保存的策略
分享網址:http://m.newbst.com/news43/151643.html
成都網站建設公司_創新互聯,為您提供網站排名、品牌網站制作、商城網站、域名注冊、網站收錄、云服務器
廣告
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源:
創新互聯