- 相關推薦
學科信息門戶中網(wǎng)絡信息導航系統(tǒng)的規(guī)范建設
學科信息門戶中網(wǎng)絡信息導航系統(tǒng)的規(guī)范建設【內容提要】根據(jù)國家科學數(shù)字圖書館(CSDL)分布式學科信息門戶及其學科信息導航系統(tǒng)建設的總體要求,描述了學科信息導航系統(tǒng)中資源選擇、資源搜尋策略、元數(shù)據(jù)、知識組織體系、維護使用管理機制等的設計規(guī)范及其開放描述要求。
【摘 要 題】信息資源建設
【關 鍵 詞】國家科學數(shù)字圖書館/學科信息門戶/學科信息導航/設計規(guī)范
中國科學院國家科學數(shù)字圖書館(CSDL)工程的一個重要任務是建立權威、可靠的學科信息門戶體系。本文首先簡要分析學科信息門戶的基本形態(tài)和CSDL學科信息門戶建設要求,然后介紹CSDL學科信息門戶中網(wǎng)絡信息導航系統(tǒng)的選擇規(guī)則、搜尋策略、內容描述機制、組織體系描述機制、組織管理機制的設計規(guī)范及其開放描述要求。
1 學科信息門戶形態(tài)
學科信息門戶致力于將特定學科領域的信息資源、工具與服務集成到一個整體中,為用戶提供一個方便的信息檢索和服務入口。學科信息門戶經(jīng)歷了不斷發(fā)展和深化的若干形式:
(1)以網(wǎng)絡學科信息導航為主的學科信息門戶,提供權威、可靠、規(guī)范和可持續(xù)的網(wǎng)絡信息資源選擇、描述和檢索[1-3],例如SOGIG(http://www.sosig.ac.uk/)、AHDS(http://www.ahds.ac.uk/)、Biz/ed(http://www.bized.ac.uk/)、EELS(http://eels.lub. lu.se/)、GeoGuide(http://www.geo-guide.de/)、MathGuide (http://www.mathguide.de/)、Martindale's Reference Desk(http: //www-sci.lib.uci.edu/HSG/Ref.html)、OMNI(http://www.omni.ac. uk/)、WWWVirtual Library(http://www.vlib.org/Overview. html)等,成為相關學科領域的核心和可信賴的信息門戶。
(2)以專業(yè)機構或圖書情報服務系統(tǒng)為基礎的信息門戶, 根據(jù)專業(yè)機構性質或其信息服務要求,將各類資源(包括網(wǎng)絡資源、數(shù)據(jù)庫、文件系統(tǒng)、知識庫、指南手冊等)組合在統(tǒng)一門戶下向用戶提供服務,其中部分門戶可支持橫向整合檢索、參考文獻鏈接、用戶虛擬社區(qū)等功能。
(3)基于跨學科門戶檢索的學科門戶體系, 支持多個學科信息門戶之間的整合檢索,例如CrossRoads[4]、Issac Network[5]、Imesh[6]、ELT[7]系統(tǒng)。
(4)基于門戶體系的數(shù)字信息服務機制, 將多個分布門戶(主要是學科信息門戶)作為整個數(shù)字信息資源的整合機制和服務渠道,讓用戶通過門戶體系方便地搜尋、調用和利用各種不同的信息資源和服務,例如英國JICS的Distributed National Electronic Resources (DNER)[8]和美國NSF的National SMETE Digital Library(NSDL)[9]。
(5)開放數(shù)字信息服務機制, 不但支持基于學科信息門戶的資源與服務集成,還進一步支持按照用戶個性化需要定制信息門戶,根據(jù)邏輯業(yè)務流程整合多個信息服務環(huán)節(jié),支持多個信息門戶之間的開放集成與定制[10],這方面的技術包括Open Digital Libraries、OpenLinking和Open Metadata機制,而且基于分布Web 服務的開放電子商務關鍵技術(ebXML[11]體系和Web Services[12 ]機制)也可在開放學科信息門戶中得到應用。
通過這些努力,可以通過學科信息門戶來邏輯地靈活地整合、可靠地組織、無縫地鏈接用戶所需的信息資源和信息服務,并支持用戶在它們基礎上的個性化集成定制,從而將一個分布和紛雜的信息空間組織成一個方便的用戶信息系統(tǒng)。
2 CSDL學科信息門戶建設
CSDL將從開放數(shù)字信息服務機制出發(fā),建立多個分布的學科信息門戶網(wǎng)站,提供權威和可靠的學科信息導航,整合學科信息資源與服務系統(tǒng),并逐步支持開放式集成定制。具體地:
(1)提供學科信息導航:針對專業(yè)研究型用戶的需要, 建立可靠覆蓋國內外本學科的權威的專業(yè)信息資源的規(guī)范導航系統(tǒng),采取標準元數(shù)據(jù)來深入描述信息資源,采取規(guī)范知識組織體系對所收集資源進行組織,提供多層次信息檢索和瀏覽功能,支持分布式信息資源選擇、描述和組織,支持定期數(shù)據(jù)自動檢驗和計算機輔助更新。
(2 )實現(xiàn)學科信息橫向整合:在學科信息門戶內橫向整合本學科領域的各種文獻信息資源系統(tǒng)(包括二次文獻數(shù)據(jù)庫、全文數(shù)據(jù)庫、聯(lián)合目錄、館藏目錄、館際互借和全文傳遞等相關服務系統(tǒng)),提供分布資源的集成界面,并逐步實現(xiàn)同構和異構數(shù)據(jù)庫的整合檢索。
(3 )實現(xiàn)學科信息縱向整合:在學科信息門戶內縱向整合本學科領域的各種文獻信息服務過程(包括文獻檢索、全文獲取、館藏資源獲取、資料傳遞、數(shù)字參考咨詢服務、個性化集成定制、SDI服務、 用戶協(xié)作交流服務等),按照用戶信息檢索與利用流程實現(xiàn)各個資源與服務系統(tǒng)間的無縫鏈接。
(4 )支持開放集成定制:通過規(guī)范元數(shù)據(jù)來描述學科信息門戶的資源對象、知識組織體系、管理機制、檢索與瀏覽機制、系統(tǒng)信息架構等各層數(shù)據(jù),通過開放語言實現(xiàn)描述數(shù)據(jù)的規(guī)范標記,通過開放搜尋機制支持對這些描述數(shù)據(jù)的發(fā)現(xiàn)和解析以及對學科信息門戶的發(fā)現(xiàn)、解析和重組,從而支持個性化定制和開放式集成。
CSDL將通過有效的學科信息門戶,將分布的數(shù)字信息資源和信息服務集成到用戶桌面,并通過開放描述機制和分布Web 服務機制來支持對各門戶及其內容的個性化定制與集成。
3 學科信息門戶中的網(wǎng)絡信息導航
CSDL學科信息門戶中的學科信息導航系統(tǒng)指具有嚴格質量控制、提供規(guī)范和深入的知識化描述、支持集成與定制的可靠的網(wǎng)絡信息資源組織和檢索系統(tǒng)。它們在協(xié)調一致的設計
規(guī)范和開放描述原則基礎上,針對本專業(yè)研究型用戶所需要的網(wǎng)絡信息資源(包括網(wǎng)站、圖書情報系統(tǒng)、文摘索引、電子期刊、科技報告、學位與會議論文、研究機構、學術團體、教育機構、學術會議、工具書、專業(yè)服務系統(tǒng)以及與學科科研緊密相關的其他資源系統(tǒng)),根據(jù)可靠的評價選擇規(guī)則、搜尋搜集策略、規(guī)范組織標引機制、檢索瀏覽機制和維護使用管理機制等,建立起可靠覆蓋本領域核心資源、基本覆蓋本領域其他主要資源、選擇性覆蓋相關學科核心資源、與其他學科信息門戶有機鏈接的網(wǎng)絡化資源與服務組織體系,并支持用戶系統(tǒng)或其他學科信息門戶對自己信息的搜尋、集成。
這樣的學科信息門戶一般具有以下特點:專業(yè)性,針對限定的專業(yè)領域,主要針對學術研究信息和教育科研用戶;集成性,把專業(yè)領域所需要的各種資源與服務凝聚到一個知識體系中;知識性,根據(jù)對知識內容及其關系的分析來選擇、描述和組織資源和服務,例如按照嚴格的評價規(guī)則,由信息專家和學科專家選擇信息資源,按照標準元數(shù)據(jù)格式和標準詞表進行著錄和標引,按照規(guī)范知識組織體系(如分類法)進行組織;智能性,提供符合專業(yè)領域特征的檢索瀏覽方式,并可在專業(yè)知識組織體系(詞表、分類法等)支持下優(yōu)化瀏覽和檢索,而且可與語義門戶(Semantic Web)結合提供智能化資源檢索和結果整合功能;可靠性,通過嚴格選擇、規(guī)范描述和持續(xù)的校驗與更新,保障導航信息的可靠性和整個組織與描述機制的可靠性。
為實現(xiàn)上述要求,學科信息導航系統(tǒng)依靠一系列規(guī)范機制來保障其有效性和可靠性,例如資源選擇規(guī)則、資源搜尋策略、資源元數(shù)據(jù)描述規(guī)范、知識組織體系規(guī)范、使用管理機制規(guī)范、分布式組織管理規(guī)范等。通過這些規(guī)范,學科信息門戶可以準確定義和描述自己的要求與運行機制,用戶可以了解和信賴學科導航信息系統(tǒng),其他系統(tǒng)也可以通過這些規(guī)范的開放描述來實現(xiàn)集成與定制。
4 資源選擇和資源搜尋控制
嚴格的資源選擇是學科信息導航系統(tǒng)知識性可靠性的關鍵保障之一,它的實現(xiàn)依靠嚴格的標準設計、規(guī)范定義和流程控制[2.13-16],至少涉及以下問題:
(1)資源選擇標準。 它幫助工作人員明確理解對資源范圍和質量的要求,幫助用戶理解和信任它的質量控制標準并在此基礎上幫助用戶判斷通過它所獲得的信息的質量,促進分布運營機制下資源選擇的一致性,幫助訓練新的資源選擇人員。資源選擇評價標準應盡可能地可操作,其中某些可量化。
資源選擇標準涉及資源范圍標準、資源質量標準和資源評價標準。其中:
●資源范圍標準,規(guī)定什么資源可被收集組織到學科信息門戶,主要涉及:a.信息內容,例如主題范圍和可接受的資源類型、資源來源、內容深度、內容權威性、內容新穎性、商業(yè)化程度等;b.接入條件,例如可接受的付費條件、技術條件、注冊要求、殘障人利用條件等;c.細粒度要求,指資源對象應該達到的信息內容詳細程度;d.元數(shù)據(jù)要求,指資源的地理與語言范圍等。
●資源質量標準,規(guī)定被選擇資源需達到的基本質量,主要包括:a.內容標準,包括有效性、權威性、實質性、準確性、全面性、唯一性、資源結構組織、及時性以及資源維護程度;b.形式標準,包括瀏覽方便性、用戶支持、標準化程度、美觀程度;c.處理標準,涉及信息完整性、站點完整性、系統(tǒng)完整性等。
●資源評價標準,用于規(guī)范化地描述選擇人員對資源的評價意見,資源評價應按照前述選擇標準從多層面描述評價結果,應能確定評價人及其評價資格,應使用標準語言進行描述,還可使用特定標記方式(例如星級標記)來簡要表示評價結果,并作為元數(shù)據(jù)的一部分被存儲和支持檢索,評價信息可被寫入資源描述摘要中。
(2)資源選擇流程規(guī)范。 一個具有一定規(guī)模的學科信息導航系統(tǒng)往往有多個專家參與資源的選擇評鑒,需要有嚴格的規(guī)范來保證選擇過程的一致性。資源選擇流程規(guī)范規(guī)定由什么人、按照什么標準和什么步驟、對什么方面的資源進行選擇評價,以及如何處理選擇評價結果。具體地,這個規(guī)范包括資源選擇標準、資源選擇流程步驟、選擇人員標準、選擇人員描述格式(以便選擇過程中的推薦、指向和咨詢)、選擇人員分工組織規(guī)定、選擇結果描述方式、選擇信息交換格式(支持協(xié)作選擇描述),還可規(guī)定是否接受用戶推薦資源、接收程序以及對推薦資源的審查和回復程序等。
(3)資源搜尋控制。 學科信息導航系統(tǒng)需要嚴謹?shù)馁Y源搜尋控制機制和相應的搜尋規(guī)范來界定搜尋范圍、過濾搜尋資源、協(xié)調搜尋操作過程,保障在有限的分布的人力下對高質量信息資源進行完整、及時、持續(xù)的搜尋,保證搜尋的有效性、一致性和連續(xù)性。資源搜尋過程需要規(guī)定搜尋途徑和方式(即通過哪些途徑和方式來搜尋和跟蹤哪些資源)、建立和維護搜尋對象目錄、分配搜尋責任、確定搜尋時序、確定資源智能過濾規(guī)則、確定資源搜尋中元數(shù)據(jù)挖掘與轉換機制、確定推薦資源審查規(guī)則、確定與其他學科信息導航系統(tǒng)的合作搜尋機制等。
所謂合作搜尋機制,指覆蓋領域相互交叉的學科信息導航系統(tǒng)間合作搜尋和共享元數(shù)據(jù)的方法,例如:a.不同導航系統(tǒng)分工負責交叉領域里不同主題范圍的資源組織,在各自知識組織體系中都包含這些主題范圍,通過直接鏈接對方資源元數(shù)據(jù)來相互利用各自的資源內容。b.不同導航系統(tǒng)分工負責不同主題范圍的資源組織,相互交換和復用交叉主題范圍的資源元數(shù)據(jù),所交換的元數(shù)據(jù)往往由接收方導航系統(tǒng)進行再標引再組織,從而共同(往往各有側重地)提供交叉領域的資源檢索。無論什么情況,都需要商定分工搜尋范圍、數(shù)據(jù)格式,并遵守共同的質量控制和著錄原則。
5 資源元數(shù)據(jù)描述
學科信息導航系統(tǒng)涉及的描述信息包括資源對象、知識組織體系、使用管理機制、檢索與瀏覽機制等層次,通過開放語言和規(guī)范方式對這些層次進行描述都構成元數(shù)據(jù)[17],成為導航系統(tǒng)元數(shù)據(jù)體系的一部分。高質量的元數(shù)據(jù)描述是學科信息導航系統(tǒng)知識性可靠性的又一關鍵保障,也需要一系列的描述規(guī)范和過程規(guī)范來定義和控制。本節(jié)主要討論對資源對象進行描述的元數(shù)據(jù),包括以下內容:
(1)元數(shù)據(jù)規(guī)范。元數(shù)據(jù)規(guī)范對元數(shù)據(jù)元素、 子元素及可能的限制屬性進行規(guī)定。資源元數(shù)據(jù)涉及內容和管理兩方面。內容元數(shù)據(jù)對資源本身進行描述,建議采用通用的或標準的元數(shù)據(jù)格式,采用規(guī)范擴展方式復用其他標準元數(shù)據(jù)格式的相關元素來描述復雜資源對象,并通過XML Namespace方式建立與元數(shù)據(jù)格式定義文件的鏈接。 例如對一個課件資源,可采用Dublin Core[18]描述基本屬性,復用IEEE LOM [19]相關元素來描述與教學有關的屬性。管理元數(shù)據(jù)用于描述資源著錄過程及其控制,一般不顯示給用戶,可被智能代理用于自動控制某些操作。可能的管理元數(shù)據(jù)元素包括維護者、上次搜尋日期、上次元數(shù)據(jù)更新日期、上次資源變動日期、預計資源重新審定日期、資源失效日期(例如會議信息)、元數(shù)據(jù)著錄者等。管理元數(shù)據(jù)可以與內容元數(shù)據(jù)捆綁在一起,但也可單獨通過一定唯一標識符與內容元數(shù)據(jù)鏈接,可支持內
容元數(shù)據(jù)的復用。管理元數(shù)據(jù)也應采用標準格式和標準擴展方式。
(2)元數(shù)據(jù)著錄規(guī)范及其他控制規(guī)范[20-22]。由于資源元數(shù)據(jù)可能來自多個途徑(例如資源系統(tǒng)本身、用戶、資源選擇人員、資源著錄人員、其他學科信息門戶、自動挖掘等),它們對元數(shù)據(jù)內容的描述方式可能有很大差異,需要通過著錄規(guī)范來具體規(guī)定如何進行元數(shù)據(jù)描述。規(guī)定內容包括:a.元數(shù)據(jù)內容編碼規(guī)范,例如關于日期、語言、各種名稱代碼、主題詞來源、分類表來源、評價等級等的標準表達方式或最佳實踐(Best Practices)。有關標準可用計算機可識別方式組織,以利著錄過程中進行查詢和自動檢驗。b.元數(shù)據(jù)元素、子元素或限定屬性的選擇方式。c.主題詞、分類號選擇標引原則和方式,這時將利用分類標引規(guī)范。d.文字描述內容(尤其是摘要、評價意見等)的撰寫規(guī)范,例如摘要來源、摘要長度、客觀性、語言風格、署名等要求。這些著錄規(guī)范被稱為Application Profiles。
除了著錄規(guī)范外,元數(shù)據(jù)檢驗規(guī)范可規(guī)定如何檢驗元數(shù)據(jù)的正確性,元數(shù)據(jù)轉換規(guī)范支持對資源內含元數(shù)據(jù)或其他學科信息門戶交換元數(shù)據(jù)進行轉換的方法,元數(shù)據(jù)挖掘規(guī)范支持根據(jù)資源內容自動析取元數(shù)據(jù)元素內容。
元數(shù)據(jù)描述過程規(guī)范將規(guī)定元數(shù)據(jù)描述的任務、程序、相應規(guī)范、有關審核控制機制(形成可靠的工作流),并可用開放語言進行描述而生成工作流元數(shù)據(jù),成為元數(shù)據(jù)描述的工作流管理的基礎。
(3)主題與分類描述規(guī)范。 對資源內容按照標準詞表進行標引和分類,是學科導航系統(tǒng)知識性的重要體現(xiàn),也是導航瀏覽和檢索質量的重要保障。因此,CSDL要求學科信息門戶選擇本學科的權威、通用、與本學科主要檢索工具一致的主題詞表和分類法來對導航系統(tǒng)資源進行主題標引和分類,并根據(jù)網(wǎng)絡資源特點、參照流行網(wǎng)絡資源目錄和國際上主要學科信息門戶來適當擴展與資源類型有關的主題詞和分類類目。所選擇的詞表必須在相應元數(shù)據(jù)元素的編碼規(guī)范屬性中予以明確,所擴展的詞匯或類目必須以定義文件形式進行描述并在編碼規(guī)范屬性中描述和鏈接,標引分類過程(包括標引分類深度)作為元數(shù)據(jù)著錄規(guī)范的一部分予以規(guī)定(可參照或直接引用現(xiàn)有的權威標引分類規(guī)范)。
6 知識組織體系描述
所謂知識組織體系,是對內容概念及其相互關系進行描述和組織的機制,支持對信息對象按照知識內容和知識結構進行描述、鏈接和組織。目前階段,CSDL學科信息導航系統(tǒng)涉及的知識組織體系主要包括主題詞表和分類表,今后嵌入語義門戶(Semantic Web)和智能檢索功能時,還將涉及語義網(wǎng)絡(Semantic Networks)和概念集(Ontologies)。對于學科信息導航系統(tǒng)而言,知識組織體系可用于:資源標引分類,資源主題檢索,資源分類瀏覽,與其他資源系統(tǒng)的檢索或瀏覽互操作。
知識組織體系本身也是一種數(shù)據(jù),利用開放語言和規(guī)范方式對它們進行描述也產(chǎn)生元數(shù)據(jù),形成關于知識組織體系的顯性知識。可通過對這些元數(shù)據(jù)的發(fā)現(xiàn)、交換和解析來識別、轉換、甚至重組知識組織體系,從而支持分布的學科信息導航系統(tǒng)間基于知識的集成以及整合檢索和整合瀏覽[23]。
知識組織體系描述可分為幾個層次:
(1)說明性描述, 即在各層元數(shù)據(jù)中對所采用的知識組織體系進行說明,并通過標準URI鏈接相應的知識組織體系定義文件, 以便用戶或用戶系統(tǒng)了解學科信息導航系統(tǒng)的知識組織體系。例如,在資源元數(shù)據(jù)的主題元素中通過編碼規(guī)范屬性定義所采用的詞表并鏈接定義文件,或在學科信息門戶信息架構描述文件中描述導航瀏覽所采用的分類體系并鏈接定義文件。
(2)定義性描述,即直接對知識組織體系結構、構成元素、 元素間關系、構造規(guī)則進行定義和描述,所形成的描述文件作為定義文件被鏈接到有關說明性描述中,以便利用知識組織體系進行擴展檢索。例如,NKOS聯(lián)盟提出VocML[24]采用標準XML DTD方式來定義和描述敘詞表和分類表及詞表映射表,支持對詞表的開放描述、解析、顯示、交換和映射。
(3)主題圖描述,即利用一定的知識組織體系, 對導航系統(tǒng)資源集合的主題內容結構、主題詞匯、主題間相互關系以及主題與具體資源的鏈接進行描述,形成資源集合的主題圖,可直接用于導航系統(tǒng)的知識化瀏覽,可建立資源集合的主題索引或交叉參照,還可鏈接復雜主題范圍的分布式資源來建立虛擬知識體系,可通過主題概念與資源的不同鏈接在同一資源體系上建立面向不同主題體系或不同用戶的資源界面。例如,XTM[25]利用XML語言標記主題圖,從而用計算機可識別的開放方式標記資源集合的主題結構和鏈接,支持主題瀏覽和基于詞表的智能檢索。
(4)概念集描述,即建立符合學科領域要求、 用開放語言描述的概念集體系(Ontology Systems),利用概念集體系對信息資源內容進行語義標注或語義挖掘,形成基于語義的資源元數(shù)據(jù)。在此基礎上,利用概念集中語義定義、語義關系定義和推理規(guī)則,實現(xiàn)基于語義的智能檢索和瀏覽[26]。
實施遞進建設的CSDL學科信息門戶,將首先嚴格按照元數(shù)據(jù)規(guī)范對知識組織體系進行說明性描述,然后支持以XTM 方式逐步深入地描述分類瀏覽結構,逐步研究和嵌入詞表定義描述,并逐步研究和嵌入基于概念集的語義門戶功能。CSDL將通過標準和公開的應用規(guī)范對知識組織體系描述方式進行規(guī)定,并逐步建立相應的詞表、主題圖和概念集描述文件。
7 管理機制描述
學科信息門戶及其導航系統(tǒng)的可靠運行和可持續(xù)發(fā)展取決于它在建設和運行中的有效管理以及相應管理機制的規(guī)范設計。在CSDL學科信息門戶中,與學科信息導航系統(tǒng)密切相關的管理機制包括資源組織機制、資源管理機制、元數(shù)據(jù)規(guī)范管理機制、用戶使用控制機制等,其中資源組織機制已在前面的資源選擇搜尋控制和資源元數(shù)據(jù)描述中予以討論。
(1)資源管理機制, 通過一系列規(guī)范對學科信息導航庫中資源內容的管理方式和程序進行規(guī)定,包括資源鏈接檢驗規(guī)范、資源更新規(guī)范、元數(shù)據(jù)記錄維護規(guī)范、資源管理流程規(guī)范等。其中,資源鏈接檢驗規(guī)范根據(jù)不同資源的變化規(guī)律規(guī)定對這些資源的可鏈接性進行檢驗的時間間隔、檢驗方式和報告形式,資源更新規(guī)范規(guī)定對資源內容進行重新審查及其修改描述、修改標引與分類、修改評價信息、刪除等處理的標準、責任分配、方式和有關技術要求,資源元數(shù)據(jù)記錄維護規(guī)范檢驗元數(shù)據(jù)記錄的唯一性、一致性、完整性和所鏈接的其他信息的有效性,資源管理流程規(guī)范則建立資源管理工作流程序和控制機制。
(2)元數(shù)據(jù)規(guī)范管理機制, 主要指對學科信息導航系統(tǒng)各種元數(shù)據(jù)規(guī)范和管理規(guī)范(包括本節(jié)涉及的管理機制規(guī)范)本身的管理規(guī)定,具體說明各種元數(shù)據(jù)規(guī)范和管理規(guī)范的描述格式和描述語言、內容描述或編碼規(guī)則、公共存放位置(以支持開放搜尋)、公
共登記要求(以支持元數(shù)據(jù)規(guī)范登記系統(tǒng)功能)、與相關資源內容的鏈接要求、與相關定義或標準文件的鏈接要求、范例記錄編制及其存放與指向要求、版本管理制度、定期審查要求、審查責任人員、管理流程規(guī)定等,從而保證元數(shù)據(jù)規(guī)范或管理規(guī)范的有序、可靠和可持續(xù)管理。
(3)用戶使用管理機制,指對信息資源使用的控制機制, 包括合法使用范圍規(guī)范、用戶身份認證方式、使用授權方式、使用審計程序、隱私保護政策等。需要區(qū)別狹義和廣義的資源使用控制。針對學科信息導航系統(tǒng),狹義控制指對導航系統(tǒng)內學科信息資源的使用控制,廣義控制可能包括對導航系統(tǒng)中的擴展信息、詞表數(shù)據(jù)、規(guī)范數(shù)據(jù)等的使用控制。無論是否限制用戶范圍,都應確定使用控制規(guī)范(因為不限制用戶只是使用控制的一種特例),界定什么使用主體(Subject )在滿足什么條件(Conditions)下可對什么使用對象(Object)行使什么使用行為(Actions)。這里,使用主體可能是用戶或用戶組、 用戶代理或另一系統(tǒng),使用對象可以是具體資源、資源范圍或數(shù)據(jù)對象,使用行為包括讀、寫、改、轉換、析取等,而條件可能是使用登記、身份認證、閱讀版權申明、填寫保證條款、支付費用等。其中某些條件的驗證與實現(xiàn)可通過鏈接第三方程序來具體實施,例如身份認證、支付費用等。CSDL學科信息導航系統(tǒng)將提供學科信息資源的公共瀏覽檢索,但為統(tǒng)計使用情況、了解用戶特點,需要進行(往往是隱蔽的)使用統(tǒng)計;對與學科導航信息相鏈接的用戶討論區(qū)、用戶發(fā)表區(qū)等擴展信息和個性化定制等擴展功能,將限制用戶范圍、要求身份認證;支持各種規(guī)范數(shù)據(jù)的公共查詢和閱讀,但嚴格控制對它們的刪改;另外,可能只允許其他CSDL學科信息門戶和授權用戶批量搜尋和下載導航資源來支持分布式導航信息組織和集成定制。
8 學科信息導航系統(tǒng)的開放描述
所謂開放描述,指信息系統(tǒng)通過開放語言和規(guī)范方式來描述自己系統(tǒng)的數(shù)據(jù)對象、規(guī)則、管理控制機制和操作過程,支持系統(tǒng)間互操作和基于智能代理的運行操作與管理。通過開放描述,將形成關于本系統(tǒng)不同描述對象的描述文件,這些文件置于本系統(tǒng)公知位置或遞交公共登記系統(tǒng),第三方系統(tǒng)可以對這些描述文件進行搜尋,按照開放語言規(guī)則進行解析,從而使第三方系統(tǒng)(或智能代理)能自動地識別、理解本系統(tǒng)的格式和規(guī)則,并在此基礎上實現(xiàn)系統(tǒng)間的互操作。開放描述并不要求采用統(tǒng)一的具體描述格式,而是規(guī)定描述時應遵循的基本原則、底層語義和語法表示方法、標準擴展方式、標準轉換機制等,因此不同系統(tǒng)可采用符合自己需要的不同具體方法或格式來描述實際內容,從而在保障各個系統(tǒng)的特殊需要和本地控制的同時,支持描述信息的開放搜尋、識別和系統(tǒng)互操作。
對于CSDL學科信息門戶及其學科信息導航系統(tǒng)而言,開放描述可分為描述方式和描述信息公布方式兩方面的要求,目前階段公布方式可采用在學科信息門戶Web服務器公知目錄下以公開文件名存放描述文件,支持第三方系統(tǒng)開放搜尋;當CSDL元數(shù)據(jù)規(guī)范登記系統(tǒng)建立后,將描述文件提交登記系統(tǒng)進行公共查詢。對描述方式,可有以下建議:
(1)資源元數(shù)據(jù)格式描述,采用Dublin Core作為元數(shù)據(jù)核心元素集,采用擴展元素或擴展屬性從其他標準元數(shù)據(jù)集中復用相關元素來描述資源的其他特征,采用Namespace方式命名所復用的元素或屬性, 采用XML DTD或RDF方式定義整個元數(shù)據(jù)集,采用XML 標記和封裝輸出的資源元數(shù)據(jù)。
(2)知識組織體系描述,采用DC Subject的Encoding Scheme屬性描述資源元數(shù)據(jù)中標引分類詞表,通過URL 鏈接相應的定義文件或介紹文件;采用XTM描述導航分類體系, 其描述文件在一定的使用控制下也置于公知位置機制,供授權的第三方系統(tǒng)(例如其他CSDL學科信息門戶)進行查詢和調用,支持資源元數(shù)據(jù)搜尋和整合;逐步支持用VocML 描述的主題詞表,相應詞表描述文件可能作為第三方定義文件在說明性描述中予以鏈接,支持嵌入的智能檢索功能。
(3)管理機制的描述, 涉及面向內部的管理規(guī)范和面向第三方的管理規(guī)范,前者包括資源組織、資源管理、元數(shù)據(jù)維護等,后者主要是用戶使用控制。面向內部的管理規(guī)范可以是文本文件或HTML/XML 文件,應存放在系統(tǒng)公知位置,供公共查詢;但也可以用XML DTD 方式定義這些規(guī)范,一方面可支持這些規(guī)范的交換和復用,另一方面可支持對規(guī)范的自動解析和處理(當然需要盡量與國內外現(xiàn)有的開放描述格式接軌)。面向第三方的管理規(guī)范應盡量采用開放語言描述,例如用戶使用控制可采用XACL[26]來規(guī)定具體控制規(guī)范,在涉及隱私保護時參照P3P[27]制定隱私保護的政策與程序。
(4)整體學科信息導航系統(tǒng)的描述, 可作為學科信息門戶信息架構(Information Architecture)定義及其描述的一部分,采用WSDL[28]開放描述語言等方法,對基本信息(例如名稱、URI、學科、 簡要描述等)、管理者信息(例如運營者、運營系統(tǒng)、聯(lián)系方式等)、管理機制信息(例如關于使用管理、權益保護、隱私保護、定制控制等的描述文件名稱、URI、描述規(guī)范Namespace等)、組織機制信息(例如元數(shù)據(jù)格式、知識組織體系、模塊結構體系以及它們的URI 和描述文件地址等)進行描述,以便第三方系統(tǒng)搜尋和解析,支持學科信息導航系統(tǒng)的開放集成定制和作為第三方服務系統(tǒng)的開放嵌入。
我們還將在學科信息門戶及其資源導航系統(tǒng)的建設中繼續(xù)探討上述問題的規(guī)范建設,并希望與國內外其他單位進行合作。
【參考文獻】
1 Subject Based Information Gateways. http://www.lub.lu.se/desire/sbigs.html
2 DESIRE Information Gateways Handbook.
http://www. desire.org/handbook/welcome.html
3 Nordic Interconnected Subject-Based InformationGateways. Final Report. August 2000.
http
://nwi.dtv.dk/anders/NISBIG/slutrapport.html
4 Crossroads. http://www.ukoln.ac.cn/metadata/roads/crossroads/
5 Isaac Network. http://scout.cs.wisc.edu/research/osaac/
6 Imesh Toolkit. http://www.imesh.org/toolkit/
7 European Link Treasury. http://mother.lub.lu.se/ELT/.en
8 Distributed National Electronic Resources. http://www.dner.ac.uk/
9 National Science, Math, Engineering and TechnologyEducation Digital Library.
http://www.smete.org/
10 張曉林.開放數(shù)字信息服務體系:概念、結構與技術.中國圖書館學報,2002(3)
11 ebXML. http://www.ebxml.org/
12 Web Services Activity. http://www.w3.org/2002/ws/
13 Bibliography on Evaluating Internet Resources.
http://www.lib.vt.edu/research/libinst/evalbiblio.html
14 Hofman P, Worsfold E. Selection Criteria for QualityControlled Information
Gateways. http://www.ukoln.ac.uk/metadata/DESIRE/quality/
15 ADAM Guidelines for the Selection of Resources forInclusion.
http://www.adam.ac.uk/adam/reports/select/
16 European Link Treasury Quality Assessment.
http://mother.lub.lu.se/ELT/about/quality.html.en
17 張曉林.元數(shù)據(jù)研究與應用.北京:北京圖書館出版社,2002
18 Dublin Core Metadata Element Set Version1.1: ReferenceDescription. 1999-07-02. http://dublincore.org/documents/dces/
19 IEEE Learning Object Metadata. http://Itsc. ieee.org/doc/wg12/LOM_WD6_3.pdf
20 Olson N B. Cataloguing Internet Resources: A Manualand Practical Guide. 2nd
edition. http://www.oclc.org/oclc/man/9256cat/toc.htm
21 Day M, Cliff P. RDN Cataloguing Guidelines. http://www.rdn.ac.uk/publications/cat-guide/
22 ROADS Cataloguing Guidelines. http://www.rdn.ac.uk/publications/cat-guide/#2
23 張曉林.描述知識組織體系的元數(shù)據(jù).圖書情報工作.2002(2)
24 Vocabulary Markup Language. http://orc.dev.oclc.org5103/nkos/bin00003.bin
25 XML Topic Maps (XTM) 1.0 http://www.topicmaps.org/xtm/1.0/xtm1-20010806.html
26 XML Access Control Language.
http://www.trl.ibm.com/projects/xml/xacl/
27 Platform for Privacy Preferences. http://www.w3.org/TR/P3P/
28 Web Service Definition Language. http://www.w3.org/TR/wsdl/
【學科信息門戶中網(wǎng)絡信息導航系統(tǒng)的規(guī)范建設】相關文章:
稅收規(guī)范管理應首推信息化建設08-15
信息網(wǎng)絡中的地方文獻08-09
研究稅收信息化建設中的信息安全技術08-18
信息室工作規(guī)范08-12
信息化與網(wǎng)絡化建設論文08-05
企業(yè)信息門戶的三個趨勢08-05
淺析信息技術學科中的差異性教學08-07
[信息技術論文]淺論網(wǎng)絡環(huán)境中的教與學08-17
信息技術學科總結08-13