piwik でリアルタイムではなくログ取り込む

piwik - オープンソースアクセス解析ソフト
Google Analitics みたいなもの。

リアルタイム解析

基本的にはこっちの方法で使う?
piwikで設定したサイトごとのjavascriptを各ページに埋め込んで使う。
アクセス解析対象のサーバが複数ある場合、
piwikもそれに耐えうる環境を用意しておく必要がある。

過去のapacheのログを取り込む

/path/to/piwik/misc/log-analytics/import_logs.py

過去のバージョンではかなり負荷が高かったけど最新バージョンでは改善されたぽい。

idはpiwik管理画面に表示されるもの

./import_logs.py --idsite=N /path/to/access_log --url=http://server/piwik/

このままではデータを取り込んだだけでグラフには表示されないので
consoleコマンドを実行する。
import_logs.pyコマンドの最後に表示されるので
そのままコピペすれば良い。

Processing your log data
------------------------

    In order for your logs to be processed by Piwik, you may need to run the following command:
     ./console core:archive --force-all-websites --force-all-periods=315576000 --force-date-last-n=1000 --url='http://localhost/piwik/'