企業(yè)網(wǎng)站建設(shè)基于網(wǎng)頁內(nèi)容的專用識(shí)別方式
日期 : 2020-12-22 12:09:11
基于網(wǎng)頁內(nèi)容的專用識(shí)別方式。由于基于網(wǎng)頁內(nèi)容的作弊方式種類繁多,很難找到一種通用的識(shí)別方式,所以一般是針對(duì)某種作弊方式設(shè)計(jì)某種專用的識(shí)別方法。
針對(duì)關(guān)鍵詞堆砌和搜索結(jié)果摘要抄襲類型垃圾網(wǎng)頁,可以考慮其與正常網(wǎng)頁在某些內(nèi)容特征上的不同,例如最為明顯的是內(nèi)容可視比例和內(nèi)容壓縮比例。
通常垃圾網(wǎng)頁的內(nèi)容可視比例和內(nèi)容壓縮比例比正常網(wǎng)頁都要高很多。除此之外,超鏈接的比例、標(biāo)點(diǎn)符號(hào)的比例、助詞的詞頻等這些指標(biāo)也可以作為識(shí)別垃圾網(wǎng)頁的特征。
針對(duì)關(guān)鍵詞堆砌和搜索結(jié)果摘要抄襲類型垃圾網(wǎng)頁,可以考慮其與正常網(wǎng)頁在某些內(nèi)容特征上的不同,例如最為明顯的是內(nèi)容可視比例和內(nèi)容壓縮比例。
通常垃圾網(wǎng)頁的內(nèi)容可視比例和內(nèi)容壓縮比例比正常網(wǎng)頁都要高很多。除此之外,超鏈接的比例、標(biāo)點(diǎn)符號(hào)的比例、助詞的詞頻等這些指標(biāo)也可以作為識(shí)別垃圾網(wǎng)頁的特征。