Google Analytics過濾設(shè)置圖文教程

Google Analytics的過濾功能簡介
Google Analytics的過濾設(shè)置其實包含兩大邏輯功能,第一種功能是我們通常意義上的過濾,即根據(jù)一定條件過濾掉一部分訪問者(本質(zhì)上是過濾掉一部分流量),例如過濾掉所有來自北京的訪問者的流量,或是只保留網(wǎng)站某個子域(subdomain)的流量。 第二種功能則不是簡簡單單的過濾,而是類似于我們使用MS Office Word的“查找并替換”功能(實際上比這個功能更強大,因為實際上包括查找、替換和重組三種功能),即按照一定的條件把GA中的一部分屬性的表述替換或再組合為另外一種表述。例如,把campaign報告中campaign的英文名字替換為漢語名字。
這樣看來,我們可以發(fā)現(xiàn)Google Analytics的主要功能是:
1. 去除掉我們不想要的一部分流量;
2. 修改一種表述方法為另外一種,或者實現(xiàn)標準報告中無法實現(xiàn)的表述。
不過,其實還有第3、4種功能
3. 因為GA是可以不斷復(fù)制的profile的,GA的filter和profile的配合可以實現(xiàn)分析需要的細分功能。不過這個功能在GA的Advanced Segments出現(xiàn)之后就弱化了。
4. 我們還可以利用多個filter進行組合而實現(xiàn)類似“解釋編程”的高級功能。這種filter的組合再加上正則表達式的共同作用,能夠?qū)崿F(xiàn)一些更復(fù)雜的過濾或者更精確的屬性表述。例如,我們知道SE(搜索引擎)都是提供Universal Search(就是除了文本搜索,還提供圖片、視頻等)的,但我們在GA中看到的流量可能都是來自Google / organic,我們?nèi)绾螀^(qū)分流量是來自文本搜索還是圖片或是視頻搜索呢?這個實際上通過filter的組合能夠?qū)崿F(xiàn)(不過這個很高深了,放在以后說)。
今天要談的這五個Google Analytics的過濾設(shè)置非常非?;A(chǔ),不熟練正則表達式也完全沒問題,只要照葫蘆畫瓢就行了。由于幾乎是我們每個使用GA的分析師都要用到的,建議把它們牢記在心。:)
安全通告:在開始下面的嘗試前,請注意!
請一定復(fù)制一個新的profile進行嘗試!
原因在于,filter和advanced segmentation不同,前者是在形成報告之前的過濾,因此過濾掉的數(shù)據(jù)肯定是不可能在該profile中出現(xiàn)了,而advanced segmentation是在形成報告之后再進行的操作,數(shù)據(jù)不會因為你的不恰當設(shè)置而丟失。所以,切記切記!否則Sidney就是害了大家。
如何復(fù)制profile,見下圖所示:
圖1
直接在同一個GA ID(例如我的GA ID是UA-4130899-1)后面點擊“+ Add new profile”,然后在下圖(圖2)中輸入你想要的profile的名字,然后點擊continue之后保存就行了。
圖2
是不是很簡單?搞定了之后,你就在剛才復(fù)制的profile下“胡作非為”吧!你以前的數(shù)據(jù)不會有任何問題了!現(xiàn)在,讓我們開始吧!
設(shè)置一:過濾掉自己對網(wǎng)站的訪問
你的網(wǎng)站最忠實的訪問者是你自己,毫無疑問。但是你自己的訪問數(shù)據(jù)也會混在其他用戶的訪問數(shù)據(jù)中,從而一定程度(程度大小取決于你網(wǎng)站的流量,如果你的網(wǎng)站流量跟新浪相差無幾,那么這個小節(jié)可以直接無視)上污染了網(wǎng)站真實用戶的訪問數(shù)據(jù)。
防止這種情況的最簡單的辦法是通過屏蔽某些IP地址來過濾掉自己的訪問,這種設(shè)置在GA中非常容易。方法如下:
1. 點擊你剛剛復(fù)制好的那個profile旁邊的edit按鈕。
圖3
2. 進入profile settings頁面后點擊“+ add filter”。
圖4
3. 在Create New Filter中用如下設(shè)置,然后輸入想取的filter的名字和自己的IP地址就好了。最后別忘了保存。
圖5
請注意,這里我們使用的是Predefined filter,也就是GA已經(jīng)預(yù)制好的幾類filter,主要就是解決這種類似的小問題。在這種filter中,不支持使用正則表達式。因此,GA自己的介紹:https://www.google.com/support/googleanalytics/bin/answer.py?answer=55496,其實是不正確的,因為其中應(yīng)用了正則表達式。
你問我,如果是動態(tài)IP怎么辦?那么你可以用自定義filter(Custom filter)選取一個IP地址范圍進行過濾,這個時候要用到Custom Filter(自定義過濾)。例如,我想要過濾掉從121.33.33.33到121.33.38.254的IP段范圍,那么我的設(shè)置如下:
圖6
這里,我們在Filter Pattern中用到了正則表達式:^121\.33\.(33\.(3[3-9]|[4-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-5]))|((3[4-7])\.([0-9]|[1-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-5])))|38\.([0-9]|[1-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-4])))$。哈哈,可怕吧!別擔心,其實你訪問這個地址,就能自動生成你IP段的正則表達式了:https://www.google.com/support/googleanalytics/bin/answer.py?answer=55572&hl=en_US&utm_id=ad。Google自己的這個工具很好用。
不過,這種方法可能會誤傷其他合理的訪問數(shù)據(jù),所以如果要精確地去除掉你每天毫無規(guī)律變動的IP地址,那么僅靠過濾功能本身就有點兒力不從心了。我們需要利用控制cookie和filter的結(jié)合來實現(xiàn),可以在這里找到一些線索:http://www.webmasterworld.com/forum39/4048.htm,這里不多說了。
設(shè)置二:改變Content報告中Top Content報告URI的大小寫
看看下面這個報告的情況是不是大家經(jīng)常遇到?
圖7
其實四個URL只代表著兩個頁面,但是由于GA是大小寫敏感(lowercase sensitive)的,因此它會認為這是不同的URL,代表著不同的頁面。
這可不太妙,對于page view這樣的度量,我們還可以直接加總,而要把該頁面的bounce rate或者avg. time on page合并起來,就有點兒麻煩了(當然其實也還是有辦法,這里按下不表,大家自己研究一下就能弄通)。所以,我們要想辦法讓GA識別這種情況。
利用Filter就能輕松解決,非常簡單。Filter的設(shè)置方法如下所示:
圖8
請注意幾點:
1. 這里利用了自定義filter(Custom filter)。
2. 選擇Lowercase是全部變成小寫,也就是所有的content報告中的頁面URI都會變成小寫,而同一個頁面URI以前是大寫的,就自動和小寫URI的合并在一起了,這樣就不會被GA記成兩個不同頁面了。如果你想全部變成大寫,用Uppercase。
3. Filter Field是我們要施加過濾功能的某一個GA屬性(dimension),Request URI指被用戶訪問(即用戶請求)的頁面的URI。URI是什么?簡單理解URI是URL去掉域名后剩下的(相對路徑)。除了Request URI,F(xiàn)ilter Field還可以選取很多其他的屬性,點擊這里看全部屬性的解釋。
設(shè)置三:把Content報告中頁面的URI變成頁面實際的Title
GA和Omniture不同,GA中顯示的網(wǎng)站頁面名字是固定好的,就是這個頁面的Request URI。而Omniture則完全可以自己定義頁面的名稱和目錄結(jié)構(gòu)。那么,如果GA不能自己定義頁面名稱,那么至少能夠想想辦法讓頁面名稱自己顯示出來吧!
沒錯!用Filter就可以實現(xiàn),具體的設(shè)置如下圖9。
圖9
大家可以看到,我們現(xiàn)在使用了自定義過濾中的高級過濾(Advanced),現(xiàn)在我稍微解釋一下我們這么設(shè)置的意義,因為相信有些符號大家會有點兒奇怪。
1. Field A –> Extract A和Field B –> Extract B是兩個數(shù)據(jù)段,這兩個并不是運算的關(guān)系,而是并列的關(guān)系。由于有兩個數(shù)據(jù)段,因此我們可以合并兩種不同的GA屬性。這兩個數(shù)據(jù)段相當于“input”,即輸入數(shù)據(jù)部分。
2. Output To –> Constructor是輸出部分,我們可以把A、B數(shù)據(jù)段中的數(shù)據(jù)按照一定方式修改,然后合并,在這個地方進行輸出。
3. A、B數(shù)據(jù)段都是支持正則表達式輸入的,上圖中的(.*)就是正則表達式,表示所有的字符。具體正則表達式的解釋請見這里(需要翻墻)。正則表達式最好了解一個原理,不過精通?恩,感覺不容易,反正我害怕這東西。
4. Output To這個數(shù)據(jù)段不支持正則表達式,因此你看到的“$A1”其實不是正則表達式。
5. $A1的意思是,F(xiàn)ield A –> Extract A中的第一個變量。上圖只有一個變量,那就只能是$A1。如果有兩個,你要在Output To中顯示第二個,那就是$A2,以此類推。同理,如果你看到$B4,你就知道是Field B中的第四個變量——說實話我還沒見過這么變態(tài)的用到4個變量的filter。
6. 整個設(shè)置的意思是說,在A字段中,我們選擇Page Title屬性,并且把頁面Page Title的所有字符(用(.*)實現(xiàn)),全部取出來。然后再把取出的這些字符(因為是A字段的第一個也是唯一一個變量)在Request URI中輸出出來。就這么簡單。
看看有什么效果?見對比圖:
圖10:【之前】
圖11:【之后】
你會說,我們不是有Content by Title報告嗎?是的,不過這個報告數(shù)據(jù)不知為何不準確,而用上面的方法,數(shù)據(jù)就是Top Content報告的數(shù)據(jù),不會在數(shù)據(jù)上再困擾我們了。
設(shè)置四:在Content報告中顯示頁面完整的URL而不是URI
有時候,我們希望在我們的content報告中顯示的不是頁面的URI(如上圖10所示),而是頁面完整的URL,我們同樣可以用Filter實現(xiàn)。
不過請注意,由于都是修改頁面的URI表示,因此設(shè)置三和設(shè)置四放在一個profile中只有一個(后設(shè)置的那個)會起效果。大家在做實驗的時候注意把這兩個設(shè)置分別放在不同的profile中。
設(shè)置如下圖12所示:
圖12
有了設(shè)置三的鋪墊,再看這個設(shè)置就很簡單了。Field A是取出網(wǎng)站的host name的每一個字符,我的網(wǎng)站host name是www.chinawebanalytics.cn/。Field B是取出頁面Request URI的每一個字符。Output To則是把A和B按照“host name”/ “Request URI”的方式進行輸出。請注意,為了表明content報告的改變是我們的filter設(shè)置的結(jié)果,我有意在這里多寫了一個“/”,實際上你在輸出框內(nèi)應(yīng)該寫“$A1$B1”。效果見下圖13。
圖13 ,現(xiàn)在大家可以看到我們多了一個“/”是我當時設(shè)定在輸出框中的
設(shè)置五:只監(jiān)測網(wǎng)站的某個子域或者某個具體目錄的流量
有時候,我們想把網(wǎng)站的某一個部分單獨拿出來進行分析,例如想要分析music.chinawebanalytics.cn(當然,這只是一個假設(shè)的域名)單獨的表現(xiàn),我們利用Advanced Segmentation或者其他方法都比較麻煩,這個時候我們可以復(fù)制一個profile,然后在這個profile中用過濾功能把我們想要的部分單獨拆分出來。
同樣非常簡單的設(shè)置,如圖14所示。
圖14
同樣的方法,在Include only的選項中選擇traffic to the subdirectories,可以實現(xiàn)只保留某一個網(wǎng)站目錄的流量。
Bonus:過濾掉不屬于網(wǎng)站的被誤記的流量
最后,給大家一個Bonus。
不知道你的網(wǎng)站出沒出現(xiàn)這樣的情況,你的Google Analytics的ID,被別人拿去放到他的網(wǎng)站中間去了!這真是讓人苦笑不得的問題。但實際上,我還真就遇到了。大家訪問這個網(wǎng)址:http://cfma.jimdo.com/,看看是不是頁面上有跟我博客http://www.chinawebanalytics.cn/一樣的GA ID!
因為這個網(wǎng)站經(jīng)常好幾天沒有任何流量,因此一段時間后我才發(fā)現(xiàn)這個問題。
這個問題完全可以通過GA Filter來解決,我們排除掉訪問這個域的流量即可,設(shè)置如圖15。
圖15
請注意,由于用的是預(yù)置過濾,因此不支持正則表達式。
好了,如果大家對Filter的一些功能有了感覺,這么長文章的辛苦也就不白費了。現(xiàn)在是大家的時間了,請大家留言,或者提出自己的問題,非常歡迎!
相關(guān)文章
- Cloudfront 是 Amazon 提供的 CDN 服務(wù),有每月免費 1T 的流量,該流量不可累計,個人小站的話,這個 CDN 是足夠用的了,而且主要是國內(nèi)訪問的速度還不錯,但是需要注意不要2023-10-19
免費為你的網(wǎng)站加速,全球訪問加速還可以防御ddos攻擊的cloudflare
CDN加速通俗來講就是把網(wǎng)站在全國各地的服務(wù)器上復(fù)制一份(即鏡像服務(wù)器),用戶在訪問的時候,路由自動分配到最近的服務(wù)器,提升訪問速度,大家在訪問軟件下載站的時候,經(jīng)2023-10-09什么是AMP(加速移動頁面)Web開發(fā)?AMP的好處以及它與響應(yīng)式網(wǎng)頁設(shè)計的
AMP技術(shù)是一項用于加速移動Web頁面加載速度的技術(shù),它通過限制頁面的HTML、CSS和JavaScript的使用,從而提高頁面加載速度和性能,下面我們將從以下幾個方面對AMP技術(shù)進行拓展2023-10-09谷歌站長(Search Console)工具的注冊安裝及功能介紹
Google Search Console 是一項由 Google 提供的免費服務(wù),可幫助您監(jiān)控和維護您的網(wǎng)站在 Google 搜索結(jié)果中的展示情況以及排查問題,Search Console 可幫助您了解并改善 Go2023-05-13打開網(wǎng)站出現(xiàn)Internal Server Error的原因和解決方法
這篇文章主要介紹了打開網(wǎng)站出現(xiàn)Internal Server Error的原因和解決方法的相關(guān)資料,需要的朋友可以參考下,解決方法:登陸FTP或文件管理器,檢查站點目錄文件權(quán)限設(shè)置,將2022-01-08inxy:超低價“綜合型”國外CDN提供商,專業(yè)POP節(jié)點覆蓋亞洲\歐洲\美洲
inxy,這個2005年成立運作至今的商家不但提供11個機房的VPS、24個機房獨立服務(wù)器,更重要的核心業(yè)務(wù)還有CDN,之所以要來推薦inxy的CDN是因為在性價比上面有著獨到的優(yōu)勢2020-11-16分享盤點10個可免費使用的網(wǎng)站CDN加速服務(wù)
大部分服務(wù)商(如阿里云,網(wǎng)易蜂巢,京東云等)的CDN服務(wù)是按使用量收費的,也有一些服務(wù)商提供免費的CDN服務(wù),這篇文章主要介紹了分享盤點10個可免費使用的網(wǎng)站CDN加速服2020-08-17INXY:運作全球26個國家和地區(qū)的 獨立服務(wù)器、VPS、CDN業(yè)務(wù),價格超便
INXY主要運作獨立服務(wù)器、VPS、CDN、DNS四大類業(yè)務(wù)。inxy有自己的機房,也賣全球其他國家和地區(qū)的相關(guān)業(yè)務(wù),可以說是一個超大型的reseller2019-09-29- 這篇文章主要介紹了新手干貨之網(wǎng)站建設(shè)中常見的一些問題,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-09-18
給我三分鐘還你一個不買視頻會員的理由,手把手教搭建電影網(wǎng)站
本篇文章主要介紹了手把手教搭建電影網(wǎng)站,今天我們就來搭建一個VIP電影網(wǎng)站,本文主旨在于,從基礎(chǔ)的搭建一個簡單的解析網(wǎng)站來引入一些思路,手把手什么的最貼心了。2019-08-22