Links

Tools

Export citation

Search in Google Scholar

運用分群演算法之關係式網頁推薦系統 ; Concept-based page recommendation by using clustering algorithm

Published in 2007 by Ming-Yuan 呂敏源; Lu
This paper was not found in any repository; the policy of its publisher is unknown or unclear.
This paper was not found in any repository; the policy of its publisher is unknown or unclear.

Full text: Unavailable

Question mark in circle
Preprint: policy unknown
Question mark in circle
Postprint: policy unknown
Question mark in circle
Published version: policy unknown

Abstract

碩士 ; 如果將網際網路看成是目前資料量蘊藏量最大,資料提供者最多的一個資料庫,那麼如何去挖掘這麼龐大的資料庫,已經是近幾年來最熱門的研究議題,然而如何在廣大的資料庫中推薦給使用者合適的網頁,隨著推薦演算法相關研究中目前可以分成以內容導向,以及協同過濾為主。但是各有其缺點。本論文主要目的為探討如何結合內容導向以及協同過濾的優點,並且藉由分群演算法來改善以往推薦演算法因為使用者及推薦項目的增加,讓推薦計算的時間呈倍數成長的缺點,並且利用叢聚係數以提高推薦系統的可信度。 在本研究中,利用了代理伺服器來搜集使用者瀏覽網路的資訊,並且透過代理伺服器所記錄的存取記錄表單來建立使用者的瀏覽行為。在使用者搜集子系統最後,將利用存取表單中的網址重新抓取使用者所瀏覽過的內容。透過文章內容前處理系統,利用內容導向的觀念以擷取關鍵字的方法來得到文章特徵的描述,經過過濾不重要的關鍵字,讓文章的焦點集中在文章的主題上。透過推薦子系統利用階層式分群法將網頁分群,利用協同過濾的方式計算使用者在群組裡的推薦項目。 ; This paper intends to exploit the idea of sharing to design a method different from common recommendation system; we use the concept of user-to-user recommendation system. Using a grouping method, the user can receive groups of high interest and other users’ related browsing groups. In this research, we used a proxy server to search for information related to the user’s browsed webpages. From the records of the proxy server we construct a profile of the user’s browsing habits. At the end of the user’s search subsystem, we will use content based concept to extract keywords to obtain the article’s characteristics’ description. Unwanted keywords are filtered, so that the article’s focus is on the topic itself. From the recommendation system, the webpages will be classified using the hierarchical grouping method, and through collaborative filtering, the recommended webpages will be chosen. ; 目錄 第1章 緒論 1 1.1 研究動機與目的 2 1.2 研究步驟 4 1.3 論文內容及大網 5 第2章 背景知識與相關研究 7 2.1分群演算法 7 2.1.1 分割式分群法 8 2.1.2 階層式分群法 9 2.2群聚度(CLUSTERING COEFFICIENT) 12 2.3英國國家標準語料庫 15 第3章.簡介推薦系統 18 3.1 推薦機制 20 3.1.1 內容導向法 21 3.1.2 協同過濾法 23 3.1.3綜合推薦法 25 第4章 關連式網頁推薦系統 27 4.1 使用者搜集子系統 29 4.1.1 代理伺服器 30 4.1.2可讀性檢測(Reading ability checking) 31 4.2 文章內容前處理子系統 32 4.2.1標點符號及數字移除 32 4.2.2 正規表示法過濾(Regular Expression Filtering) 33 4.2.3 關鍵字 36 4.3 網頁推薦子系統 38 第5章 實作介面 40 5.1 實作介面 40 5.2 實驗結果與討論 41 第6章 結論與未來研究方向 43 6.1 結論 43 6.2 未來研究方向 44 參考文獻 45 附錄 47 表目錄 表2.1 BNC語料內容分類表 17 表2.2 BNC語料與年齡關係表 17 表3.1 推薦演算法範例圖 18 表4-1 LOG FORMAT 29 表5.1 分群時間 41 表5.2 推薦時間比較圖 41 圖目錄 圖2.1 階層式分群演算法之流程圖 12 圖2.2 群聚度範例圖 14 圖4.1 階層式網頁推薦圖 28 圖4.2 使用者資料搜集系統 30 圖4.3 文章前處理系統 33 圖4.4 使用者群組概略圖 39 圖5.1 推薦介面圖 40 ; 學號: 694190637, 學年度: 95