Piwiki修訂版是一款開源網(wǎng)站訪問統(tǒng)計系統(tǒng),因此該軟件可以幫助用戶們?nèi)ケO(jiān)測網(wǎng)頁瀏覽人數(shù), 訪問最多的頁面,可以幫助用戶們查詢網(wǎng)站的核心搜索關(guān)鍵詞等等信息,讓用戶們可以通過該信息去優(yōu)化自己的網(wǎng)站,從而提升網(wǎng)站在各大搜索引擎上的排名。
操作說明
剛裝好的Piwik是空空如也的,此時我們需要這個系統(tǒng)幫我們統(tǒng)計數(shù)據(jù)。目前Piwik支持兩種采集用戶訪問記錄的方式: JS追蹤和訪問日志追蹤。JS追蹤可定制型高,可以獲取到用戶的分辨率,瀏覽器插件等等,還可以捕獲自定義變量。訪問日志追蹤(如apache的accesslog)可以追蹤到用戶的錯誤請求(如40X錯誤,有助于捕獲到惡意用戶和爬蟲,蜘蛛等等),目前這兩種追蹤得到的數(shù)據(jù)還不支持合并。
JS追蹤
在管理設(shè)置-網(wǎng)站-右邊即可看到"顯示跟蹤代碼",如下圖所示:
將此代碼復(fù)制到web項目的footer中即可(即所有頁面都嵌入這段相同的js代碼,用于捕獲用戶的信息,如分辨率,瀏覽器UA,IP等),還可以按照官方文檔,捕獲自定義變量。
log追蹤
log追蹤無需修改web項目,但是必須要有登錄服務(wù)器并讀取accesslog的權(quán)限。
log追蹤的過程是解析webserver的accesslog,然后通過piwik的API上傳,最終在piwik頁面上展示。
這個過程不用自己去實現(xiàn)了,piwik的壓縮包中已經(jīng)帶有一個python腳本可以幫助我們完成這個工作了,該腳本存儲于piwik目錄下的misc/log-analytics/import_logs.py。
將這個腳本遠(yuǎn)程拷貝到目標(biāo)服務(wù)器上,按照腳本的參數(shù)格式執(zhí)行即可,我的命令行:
1./import_logs.py --url=http://192.168.1.106/piwik/ --idsite=1 --recorders=2 --token-auth=319fb461d3225905039551e861edde60 --enable-static --enable-bots --enable-http-errors --enable-http-redirects /var/log/apache2/access.log
使用--help參數(shù)即可看到這個腳本的命令行,只有一個--url參數(shù)是必須的,指明piwik的訪問路徑。
這里對我使用的參數(shù)做一下簡介:
--idsite表明抓取到的信息上傳到哪個序號對應(yīng)的網(wǎng)站(這里的參數(shù)為1,代表解析的數(shù)據(jù)會統(tǒng)計到first_web這個網(wǎng)站中)
--token-auth這個參數(shù)是管理員的訪問token,在系統(tǒng)頁面最頂上的API點開即可看到,如下圖所示。這個參數(shù)可以使用--login=LOGIN --password=PASSWORD這兩個參數(shù)替代,必須是管理員的賬戶和密碼。
--recorders使用多線程解析,默認(rèn)為1,官方建議這個參數(shù)和核心數(shù)一致。
--enable-static --enable-bots --enable-http-errors這三個參數(shù)基本上把a(bǔ)pache的accesslog能抓取到的全部信息都抓全了,抓取靜態(tài)資源(jpg,png,js,css等非html的訪問),抓取bots(不知道這個是什么,猜測是否是機(jī)器人?),抓取html錯誤碼(如40X請求等等)
/var/log/apache2/access.logapache的accesslog存放路徑,常見的webserver如nginx,lighthttpd等,腳本自帶有解析引擎,無需別的參數(shù),如果非常見webserver的話,加上--log-format-regex這個參數(shù)來自定義日志格式抓取。
當(dāng)腳本執(zhí)行完畢時,即可在piwik中看到網(wǎng)站的訪問記錄了,使用也很方便。長期使用可以寫入crontab即可。
注意:
log解析的方式追蹤比較慢,不適合實時追蹤用戶訪問記錄,建議每過幾小時執(zhí)行一次crontab,來定時解析log。
如果開啟了--enable-static --enable-bots --enable-http-errors這三個參數(shù),解析過程將會很緩慢(我這邊大概十幾條每秒),不要讓crontab太頻繁,會直接讓mysql數(shù)據(jù)庫超出連接而掛掉,我是每4小時執(zhí)行一次crontab。
標(biāo)簽: 網(wǎng)站管理 web統(tǒng)計
相關(guān)版本
下載地址
-
3 中國菜刀
裝機(jī)必備軟件
網(wǎng)友評論