欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

PHP實(shí)現(xiàn)通過中文字符比率來判斷垃圾評(píng)論的方法

 更新時(shí)間:2014年10月20日 15:10:48   投稿:shichen2014  
這篇文章主要介紹了PHP實(shí)現(xiàn)通過中文字符比率來判斷垃圾評(píng)論的方法,是一個(gè)比較實(shí)用的技巧,對(duì)于進(jìn)行PHP應(yīng)用程序開發(fā)來說有一定的參考借鑒價(jià)值,需要的朋友可以參考下

本文實(shí)例講述了PHP實(shí)現(xiàn)通過中文字符比率來判斷垃圾評(píng)論的方法。分享給大家供大家參考。具體實(shí)現(xiàn)方法如下:

一、需求:

最近一段時(shí)間常常出現(xiàn)這類垃圾評(píng)論:一大段英文字符里夾雜一兩個(gè)生僻漢字,包含了中文字符,而且又沒包含啥中文的敏感詞,所以就堂而皇之的通過了評(píng)論過濾。對(duì)這類評(píng)論的處理可以采取判斷中文字符的比率來確認(rèn),但是也會(huì)存在一定的誤判。

二、解決方案:

要用到php的兩個(gè)函數(shù)strlen和mb_strlen,strlen會(huì)把單個(gè)漢字長(zhǎng)度認(rèn)定為3,mb_strlen單個(gè)漢字長(zhǎng)度為1。同一段字符通過兩個(gè)函數(shù)取得的長(zhǎng)度之差就是實(shí)際漢字字符數(shù)的二倍,除以二就得到實(shí)際的字符數(shù),在與mb_strlen取得的長(zhǎng)度求比值就得到漢字占總字符數(shù)的比率。

三、實(shí)現(xiàn)代碼:

復(fù)制代碼 代碼如下:
$len_all = strlen($comment['text']);                     
 $len_st = mb_strlen($comment['text'], 'UTF-8');
 if(($len_all-$len_st)/(2*$len_st) < 0.5){
        $error = "中文字符少于百分之五十"; 
 }

如果在評(píng)論中貼代碼的話,就會(huì)造成中文字符比率低,需要過濾掉代碼字段再來判斷。

希望本文所述對(duì)大家的PHP程序設(shè)計(jì)有所幫助。

相關(guān)文章

最新評(píng)論