題名: | 在超連結環境下針對資訊分類相關權威網頁之探勘 |
其他題名: | Mining the Authoritative pages for Information Categorization in a Hyperlinked Environment |
作者: | 何裕琨 曾耀順 |
關鍵字: | 資訊尋找 資訊分類 超連結 權威權重 權重臨界值 |
期刊名/會議名稱: | 2001 NCS會議 |
摘要: | 隨著網際網路(Internet)科技的進步,與資訊量快速的成長,如何快速找到契合需求的資訊相對愈顯困難。網際網路之超文字(hypertext)是利用超連結(hyperlink)來建立相互之關係,超連結的結構中隱含著代表人類高程度的抉擇,當網頁與另一網頁建立連結,即代表此網頁對連結至的網頁在主題相關性上的肯定。在傳統之全文檢索模式無法有效率提供有關主題資訊的情況下,利用超連結之關係作資訊檢索是一個可行之辦法。 本論文利用網際網路的超連結(hyperlink)之結構,以有向圖(direct graph)的概念將網頁文件視為節點(nodes)及超連結視作有向邊(direct edge),以便利用有向圖形來計算超連結與相關網頁之關係,藉以判斷某網頁文件在某一主題上之重要性。透過連結的鏈結數分別設定權威權重(authoritative weight)與發散權重(hub weight),並利用權威網頁文件的平均權重值當作權重的臨界值(weighting threshold),藉以過濾掉相關主題性較低的權重,當作是否取捨網頁文件與進行資訊分類的依據。 利用真實網站分類目錄之實驗分析,證實本論文提出之以權重臨界值當作主題相關程度的判定之方法,可以有效進行主題分類的功能。透過空間向量模式(space vector model )來計算查詢關鍵字與檢索結果網頁文件的相似度,發現透過連結權重計算之方式,的確能分類出具有較高主題相似度的網頁文件,並可達到良好的檢索效果。 |
日期: | 2006-10-18T10:59:03Z |
分類: | 2001年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
ce07ncs002001000189.pdf | 209.52 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。