圖書信息
- 《面向學科領域的網絡信息資源深度聚合與服務研究》
-
項目背景
本書是國家社科基金重大項目“面向學科領域的網絡信息資源深度聚合與服務研究”的結項成果, 孫建軍教授是該項目的首席專家。 - 回目錄
第一部分 概述
1 學科資源聚合與網絡導航
“聚合”在《現代漢語詞典》中意為“聚集到一起”,在信息科學中指的是將數據進行清洗、篩選、分析以得到所需結果的過程。
1.1 學科資源傳統聚合方式
學科信息資源的內外部特徵是資源聚合的基礎,作為傳統館藏資源特徵描述的重要方式,文獻目錄與元數據可助推粗粒度的資源聚合。
1.1.1 基於文獻目錄的資源聚合
文獻目錄是基於特定的規範、格式標註文獻的工具,以提升文獻的存儲和檢索效率,涵蓋文獻的外部特徵、一定的內部語義。
1.1.2 基於元數據的資源聚合
整合方法可以基於系統設計和數據庫建設兩個維度,完善的建設體系及元數據互操水平是元數據在倉儲建設過程中資源整合有效提升的核心。
Q: 文獻目錄和元數據什麼區別?
是否可以理解為
文獻目錄主要用於描述紙本資源,包括書名、作者、尺寸、索書號、館藏地等信息
元數據主要用於描述電子資源,包括書名、作者、文件格式(PDF)、doi、url 等信息
1.2 學科資源語義聚合方式
學科資源語義聚合基於挖掘概念、詞語間的語義關聯,分析資源間內在的語義關係,以支撐知識組織、推薦服務。
1.2.1 基於領域本體的資源語義聚合
作為哲學的一個分支,本體論(Ontology)是一門有關存在及其本質和規律的科學。
Curber 提出的定義得到公認:本體是概念模型明確的規範説明。
1.2.2 基於文獻計量的資源語義聚合
文獻計量的分析對象不僅涉及文獻內容特徵(如關鍵詞、主題詞等),也涉及文獻外部特徵(如作者、機構、地區等)。
Q:文獻檢索區分篇關摘與刊名、作者的必要性
1.2.3 基於概念關聯的資源語義聚合
定義:直接從文獻中提取詞語,並基於詞語間語義關聯分析完成深層次的文獻資源語義聚合。
1.2.4 基於關聯數據的資源語義聚合
關聯數據(linked data)是館藏資源聚合的常用方式。
關聯數據是 Tim Berners-Lee 提出的語義網輕量級實現方式,可以將跨來源、跨類型的數據關聯起來,實現知識共享、序化。
1.3 網絡導航
1.3.1 網絡導航的產生及內涵
網絡信息導航的基礎數據結構是知識樹,依據體系分類法以及某類提前明確的概念體系架構,逐層分門別類地實現網絡信息資源組織。
1.3.2 網絡導航工具
網絡導航工具研發的目的是幫助用户尋找所需信息,最常見的三類網絡當行工具是搜索工具、站點地圖以及索引。
Q: 站點地圖和索引看起來差不多
1.4 學科資源聚合與網絡導航的基本結構
以 CiteseerX 系統為例,概貌性地介紹學科信息資源聚合以及網絡導航系統的結構和主要模塊。
1.4.1 系統架構
三層架構:存儲層、應用層和用户接口層
1.4.2 系統主要功能
前端:通過 Web 服務處理用户請求
後端:爬取數據並解析存儲,更新索引本文出自 qbit snap