題名: 在超連結環境下針對資訊分類相關權威網頁之探勘
其他題名: Mining the Authoritative pages for Information Categorization in a Hyperlinked Environment
作者: 何裕琨
曾耀順
關鍵字: 資訊尋找
資訊分類
超連結
權威權重
權重臨界值
期刊名/會議名稱: 2001 NCS會議
摘要: 隨著網際網路(Internet)科技的進步,與資訊量快速的成長,如何快速找到契合需求的資訊相對愈顯困難。網際網路之超文字(hypertext)是利用超連結(hyperlink)來建立相互之關係,超連結的結構中隱含著代表人類高程度的抉擇,當網頁與另一網頁建立連結,即代表此網頁對連結至的網頁在主題相關性上的肯定。在傳統之全文檢索模式無法有效率提供有關主題資訊的情況下,利用超連結之關係作資訊檢索是一個可行之辦法。 本論文利用網際網路的超連結(hyperlink)之結構,以有向圖(direct graph)的概念將網頁文件視為節點(nodes)及超連結視作有向邊(direct edge),以便利用有向圖形來計算超連結與相關網頁之關係,藉以判斷某網頁文件在某一主題上之重要性。透過連結的鏈結數分別設定權威權重(authoritative weight)與發散權重(hub weight),並利用權威網頁文件的平均權重值當作權重的臨界值(weighting threshold),藉以過濾掉相關主題性較低的權重,當作是否取捨網頁文件與進行資訊分類的依據。 利用真實網站分類目錄之實驗分析,證實本論文提出之以權重臨界值當作主題相關程度的判定之方法,可以有效進行主題分類的功能。透過空間向量模式(space vector model )來計算查詢關鍵字與檢索結果網頁文件的相似度,發現透過連結權重計算之方式,的確能分類出具有較高主題相似度的網頁文件,並可達到良好的檢索效果。
日期: 2006-10-18T10:59:03Z
分類:2001年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
ce07ncs002001000189.pdf209.52 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。