<th id="6yc0e"></th>
  • <samp id="6yc0e"><pre id="6yc0e"></pre></samp>
  • <ul id="6yc0e"><pre id="6yc0e"></pre></ul><ul id="6yc0e"><pre id="6yc0e"></pre></ul>
    <samp id="6yc0e"><pre id="6yc0e"></pre></samp>
  • <th id="6yc0e"></th>
    <samp id="6yc0e"></samp>
  • <kbd id="6yc0e"><pre id="6yc0e"></pre></kbd>
    <samp id="6yc0e"></samp>
    <ul id="6yc0e"><tbody id="6yc0e"></tbody></ul>
  • <samp id="6yc0e"></samp>
  • 在线免费成人亚洲av,无码毛片一区二区本码视频,亚洲日韩一区精品射精,国产99视频精品免费视频36

    Frame頁面網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理方法的論文

    時(shí)間:2021-06-11 09:11:33 論文 我要投稿

    關(guān)于Frame頁面網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理方法的論文

      摘 要

    關(guān)于Frame頁面網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理方法的論文

      本文結(jié)合網(wǎng)絡(luò)日志數(shù)據(jù)挖掘技術(shù),通過對Frame頁面和SubFrame頁面進(jìn)行分析,提出基于改進(jìn)的Frame頁面數(shù)據(jù)挖掘預(yù)處理方法。該方法從SubFrame頁面信息著手,從而提高預(yù)處理過程中的信息識別能力。實(shí)驗(yàn)表明,該方法在網(wǎng)絡(luò)日志的數(shù)據(jù)挖掘預(yù)處理過程中,有效提高了信息的精準(zhǔn)度。

      【關(guān)鍵詞】數(shù)據(jù)挖掘 Frame頁面 SubFrame頁面

      1 引言

      隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,簡單的信息搜索技術(shù)已經(jīng)不能滿足現(xiàn)階段網(wǎng)絡(luò)信息獲取的需求。網(wǎng)絡(luò)日志數(shù)據(jù)挖掘技術(shù)是結(jié)合網(wǎng)絡(luò)日志用戶的訪問行為規(guī)律、興趣需求等信息,加以分析,優(yōu)化網(wǎng)絡(luò)內(nèi)容與網(wǎng)絡(luò)文本文檔的組織結(jié)構(gòu),以此提高網(wǎng)絡(luò)站點(diǎn)的競爭力。我們發(fā)現(xiàn)網(wǎng)絡(luò)日志記錄往往十分龐大,傳統(tǒng)的預(yù)處理方法,并不能很好解決日志頁面對站點(diǎn)組織結(jié)構(gòu)的影響。因此,進(jìn)行網(wǎng)絡(luò)日志預(yù)處理方法的研究,具有一定的現(xiàn)實(shí)意義。

      對于傳統(tǒng)的網(wǎng)絡(luò)日志的數(shù)據(jù)挖掘,預(yù)處理階段的Frame頁面和SubFrame頁面在用戶會話文件出現(xiàn)的概率很高,這就降低了會話識別的興趣度。因此,必須消除Frame頁面對網(wǎng)絡(luò)日志數(shù)據(jù)挖掘的影響。我們將Frame頁面以及其SubFrame頁面被看為一個(gè)整體,用Frame頁面代替通過會話文件尋找Frame頁面和Subframe頁面,并剔除多余的頁面,以提高日志數(shù)據(jù)挖掘的興趣性。

      2 改進(jìn)的'Frame頁面數(shù)據(jù)挖掘預(yù)處理方法

      通過對Frame頁面過濾方法,結(jié)合實(shí)際情況分析,我們利用ID3決策樹算法,提出基于改進(jìn)的Frame頁面過濾方法,以提高網(wǎng)絡(luò)日志數(shù)據(jù)挖據(jù)的效率。該方法如下:

      輸入:FS表(pidframne , pidsubframe)所對應(yīng)的集合;集合屬性包括 {index.html,top.html,left.html,main.html,…}

      輸出:判定策略

      For each users session

      {

      currentframe=null

      make_node(web)

      if((cerrenframe, pid, ∈FS) make_tree(currentframe,web_left)

      Else if pid, ∈dom(FS)

      {curremtframe pidi make_decition_tree(currentframe,web_left}

      else make_decition-tree(currentframe,web_rleft

      if attribute_list=null{make_decition_tree(currentframe,web_right);}

      else if(one ofattribute_list)>allgain

      currentframe=test-attribute;

      make_decition(ai,web_left)

      Else generate_decision_tree(ai,web_right)

      }

      上述策略認(rèn)為,訪問站點(diǎn)的頁面為根節(jié)點(diǎn),具有信息增益最高的特征,currentframe變量記錄web當(dāng)前頁面pidi。若當(dāng)前頁面pidi不屬于frame頁面,則歸類左子樹,反之當(dāng)前頁面pidi歸入右子樹。即pid,∈DOM(FS)。而frame頁面的subframe頁面歸類左子樹。這樣一來,frame頁面為決策樹右樹,subframe頁面為決策樹左樹,subframe頁面在會話識別階段得到保留,以便后續(xù)路徑補(bǔ)充。該方法優(yōu)化了站點(diǎn)的組織結(jié)構(gòu),較好提升了網(wǎng)絡(luò)日志數(shù)據(jù)預(yù)處理效率。

      3 實(shí)驗(yàn)分析

      我們通過Frame頁面過濾預(yù)處理方法實(shí)驗(yàn),驗(yàn)證本文提出的改進(jìn)方法。實(shí)驗(yàn)提取700個(gè)日志所記錄的訪問頁面,共20萬條日志文件,結(jié)合本文提出的改進(jìn)Frame頁面網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理方法,與傳統(tǒng)頁面預(yù)處理方法進(jìn)行對比測試。結(jié)果如表1所示。

      在表1中,絕對支持度表示用戶頻繁訪問頁面的最小會話數(shù),F(xiàn)Si表示用戶頻繁訪問頁面集合數(shù),*為用戶不感興趣的頁面集,△表示頁面集是用戶感興趣的,△△表示頁面集用戶感興趣程度加強(qiáng)。實(shí)驗(yàn)表明,改進(jìn)Frame頁面過濾方法相比傳統(tǒng)方法,預(yù)處理結(jié)果得到提高,因此,網(wǎng)絡(luò)日志的數(shù)據(jù)挖掘效率得到加強(qiáng)。

      4 小結(jié)

      本文通過對網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理技術(shù)進(jìn)行分析,結(jié)合預(yù)處理過程中的實(shí)際情況,著重考慮SubFrame頁面剔除對站點(diǎn)組織結(jié)構(gòu)的影響,提出了改進(jìn)的Frame頁面網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理方法,實(shí)驗(yàn)表明,該方法較好的提高了網(wǎng)絡(luò)日志數(shù)據(jù)挖掘的預(yù)處理精度和效率。

      參考文獻(xiàn)

      [1]方元康等.一種改進(jìn)的Web日志會話識別方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2008,18(11):214-216.

      [2]朱明.數(shù)據(jù)挖掘[M].合肥:中國科技大學(xué)出版社,2008:13-56.

      [3]朱志國等.持久偏愛的Web用戶訪問路徑信息挖掘方法[J].情報(bào)學(xué)報(bào),2010,29(2).

      [4]凌海峰等.基于混合蟻群算法的web用戶會話聚類[J].計(jì)算機(jī)工程與應(yīng)用,2013(22).

      [5]韓法旺.Web日志挖掘數(shù)據(jù)預(yù)處理過程研究[J].南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2012(2).

      [6]凌海峰等.基于聚類的web用戶會話識別優(yōu)化方法[J].計(jì)算機(jī)應(yīng)用研究,2012(8).

    【Frame頁面網(wǎng)絡(luò)日志數(shù)據(jù)挖掘預(yù)處理方法的論文】相關(guān)文章:

    數(shù)據(jù)挖掘論文03-31

    數(shù)據(jù)挖掘論文07-15

    數(shù)據(jù)挖掘教學(xué)方法研究論文07-04

    專利數(shù)據(jù)挖掘的論文06-12

    數(shù)據(jù)挖掘論文精選5篇論文06-13

    網(wǎng)絡(luò)數(shù)據(jù)挖掘規(guī)劃論文04-03

    大數(shù)據(jù)自動(dòng)分析與數(shù)據(jù)挖掘探討的論文04-26

    數(shù)據(jù)挖掘技術(shù)在WEB的運(yùn)用論文04-26

    數(shù)據(jù)挖掘在CRM中的應(yīng)用論文04-10

    主站蜘蛛池模板: 久久精品国产亚洲AV麻| 无遮挡免费高清羞羞视频| 亚洲欧美日产综合在线网| 亚洲AV永久无码精品天堂动漫| 久久精品国产亚洲av天海翼| 亚洲午夜成人精品电影在线观看| 97无码人妻福利免费公开在线视频| 国产国拍亚洲精品永久软件| 久久精品国产国产精品四凭| 韩国免费a级毛片久久| 天下第二社区在线视频| 国产亚洲精品成人aa片新蒲金 | 精品人妻日韩中文字幕| 精品亚洲欧美无人区乱码| 深夜精品免费在线观看| 护士张开腿被奷日出白浆| 亚洲人成网站77777在线观看| 乱子真实露脸刺激对白| 国产亚洲精品VA片在线播放| 午夜无码电影888不卡| 暖暖 在线 日本 免费 中文| 在线日韩日本国产亚洲| 精品国产午夜福利在线观看| 日本高清在线观看WWW色| 欧美日韩中文国产一区发布 | FC2免费人成在线视频| 最近中文字幕日韩有码| 亚洲中文字幕无码一久久区| 丁香婷婷色综合激情五月| 一本一道av无码中文字幕麻豆| 成人免费精品网站在线观看影片| 亚洲精品日本一区二区| 欧美成人家庭影院| 欧美人与动人物牲交免费观看| 国产乱码1卡二卡3卡四卡5 | 猫咪AV成人永久网站在线观看| 亚洲一二区制服无码中字| 国产破外女出血视频| 欧美国产日韩A在线观看| 亚洲中文字幕无码专区| 亚洲精品久久久久久婷婷|