エクセルで来訪者分析!

インターネットでWEBページを見たときの動向をログとして
残している場合があります。
そのデータを分析することによって、どのページに来訪が多い・・・などが分かる訳です。
今回は、ログデータを使用して、PV数、UU数を出してみましょう!

1. 以前紹介しています、ユニーク数の出し方を利用して、セッションIDのユニークリストを作成します。

2. 「1」で抽出された、「セッションID」「来訪者ID」を別シートにコピーします。

3. ここで、セッションIDの合計件数が、PV数となります。
また、各セッションIDを検索値として、ログデータのセッションIDから
1かたまりのセッションに何回動きがあるか数えることができます。(関数:COUNTIF)
4. 同様にして、「来訪者ID」のユニークリストを作成したときの合計件数が、UU数となります。
5. 来訪者IDのユニークリストを利用して、各来訪者がログの期間内で何回そのサイトを
訪問したかもわかります。
来訪者IDユニークリストの来訪者を検索値にして、1.で作成したセッションIDユニークリストの
来訪者IDから、来訪回数がわかります。(関数:COUNTIF)
ログ、セッションIDユニークリスト、来訪IDユニークリストを利用すれば
来訪者毎の平均ページビュー数なども調べることができるのでは・・・!?
※ あくまでも、手法の一つとしてご覧下さい。

IISのログを検証してみた

ログ解析をやっていると、WINDOWSサーバーをご使用の場合もあり、IISちゃんに出会ってしまうのです。基本的には解析できるんだけど、なんか時間がずれちゃうんだよねーー、ということで、IISのサーバーログに記録されている時間について調査をしました。

メーラーのUA(ユーザエージェント)の調査〜序章

さて、メールに関して皆さんどんなことを知りたいと思っていますか?
メールの開封率?メールのクリック率?メールからのコンバージョン率?
概ね、どうやってメールを見ているか?なんてことは気にされることは少ないように思います。
今回テーマにしたことは、ホームページでいえば、ユーザが使用しているWEBブラウザはどのアプリケーションで、どのバージョンが多いのか?という事です。
ホームページだと当たり前にやっていることが、メールになった途端ちゃんとやれていないものです。
HTMLメールでもなければ、機種依存文字に気をつけていればそれほどレイアウトが崩れることもないですから、当然といえば、それまでですが・・・
ホームページを作る人より、メールを書く人の方が多いという現実もありますから、在り方がそもそもちがうのでしょう。ある意味、電子メールクライアントはWEBブラウザよりも身近な存在では無いでしょうか?
前置きが長くなりましたが、それでは本題の電子メールクライアントについてどこまで知れるのか?を見ていきましょう。
メールを見る環境で大きく分けると、
【A】ローカルアプリケーション
【B】WEBメール(フリーメールなど)
の2つになります。ここまでは簡単ですね。
前者はOutlookExpressやThunderbirdなど、パソコンにインストールするタイプのアプリケーションです。
後者はYahoo!メールやGmailなどインターネット上のサービスで、WEBブラウザでアクセスするものです。
どこまで知れるのか?といった場合に、どういうメールを送るかによって大きく異なります。。
一般的にはメールには
●テキストメール(プレーンテキスト)
●HTMLメール
の2種類ありますが、テキストメールの場合には電子メールクライアントの情報はほとんど期待できません。
WEBメールで見ていればクリックした場合に限り、リファラーにWEBメールサービスのURLが残るため環境を特定できます。これがプレーンテキストメールでは限界のようです。
URLをクリックした時点で、そこからはブラウザの役目だからです。
それに対してHTMLメールの場合は、もう少し情報を得ることができます。
HTMLメールを受信したときに現れる「画像を表示する」ボタンがそのカギです。
「画像を表示する」ということは「サーバへリクエストを送信する」ということで、「HTML」メールなのですからもちろんリクエスト先はWEBサーバです。
ホームページを見る場合にWEBサーバにリクエストする際には通常WEBブラウザのUA情報が送信されますから、HTMLメールの場合はリクエストをしているメールソフトの情報が表示されるはずです。
しかし、今までログ解析をしている中で、メールクライアントのUAを気にしたことがありませんでした。
WEBメールに関してはテキストメール同様、リファラーにどのサービスかの情報が残ることは知っています。
しかしメールソフトに関しては漠然と「UA情報はない」という考えがありました。
でも、です。
最近、ふとUA情報を送るメールクライアントの存在に気づきました。Thunderbirdです。
HTMLメールを表示する際にちゃんとUA情報を送信していました。
それで、各種ローカルアプリケーションのメールクライアントで試してみました。
【WindowsXP - OutlookExpress】
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
【WindowsXP - Thunderbird】
Mozilla/5.0 (Windows; U; Windows NT 5.1; ja; rv:1.8.1.17) Gecko/20080914 Thunderbird/2.0.0.17
【Mac OSX - Mail】
Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10_4_11; ja-jp) AppleWebKit/525.18 (KHTML, like Gecko)
【Mac OSX - Thunderbird】
Mozilla/5.0 (Macintosh; [...]

MSスパム 続報 「そして、終わりなき戦い」

以前ご紹介をした「アクセス解析で出会う「copyright」について」なのですが、その犯人は、Microsoft様でございました。
そのリファラーらしきものを探すには「FORM=QBHP」と言うことだったんです・・・。

アクセス解析で出会う「copyright」について

サーバーログで調査・分析を行っていると、変なログに出会うことがあります。
今回は、その変なログについて、お知らせしますね。
なんとそれは、恐れ多き「Microsoft」様のリファラースパム?!的な感じなのですよ。。。