logblog

分析とかデータベースとかの関心ごと

【基本】セッションとは?正しく定義を理解しよう

分析を行う上で、必ず使う用語として「セッション」があります。

今回は「セッション」って何だっけ?というそもそもの定義の説明をしたいと思います。

 

そもそも、セッションってなんだ!

セッションとは、サイト訪問から離脱までの1連の流れのことです。

セッション定義こんな感じのイメージが頭にあれあ大丈夫だと思います。

分析するときもこのセッションの定義を使って分析していくことが大半です。

ユーザーなのか、セッションなのか、PV軸で分析していくのか?というのは、
サイトの構成だったり、目的で変化させていくます。

 

セッションが切れる時はどんな時?

上記定義で説明した通り、セッションは離脱したときに切れます。
ですが、離脱と判断されるときってどんな時なのだろうという説明です。

細かいものを除くと、大きく3つです。

  1. 30分何も操作されなかったとき
  2. 日付をまたいだ時
  3. 参照元が変わったとき

1.30分何も操作されなかったとき

基本的には30分間です。GAの設定画面でここの長さは変更できます。

例えば、Aページを見た後に席から離れて、30分後に席に戻ってきたとします。
そして、AページからBページへ遷移したとき、同時に新しいセッションが始まります。

ある操作をしてから30分間なんの操作もされなかったときセッションは切れます。

2.日付をまたいだ時

日付が変わったときもセッションが切れてしまします。

同じサイトを見ていたとしても5/11の23:50から5/12の1:00までサイトを見ていたのならば2セッションということになります。

3.参照元が変わったとき

参照元が変わったときも離脱と判断されます。
参照元が変わるということは、新しく流入が始まったと判断されるので、、セッションが切れてしまします。

たとえば、サイト内のリンクにutmパラメータを張っていた場合、同じサイト内の回遊であっても、utmパラメータで参照元が変わってしまうので、新しいセッションが始まったと判断されます。

 

今回は、セッションの定義とセッションが切れる3パターンを紹介しました。

ご質問、こんなことを書いてほしい等ありましたら気軽にコメントください!

ご精読ありがとうございました

【超マニアック】GoogleAnalyticsのセグメント条件の「含む」を除外と「含まない」を含む

Google Analytics上でのセグメント条件のほんとにほんとに細かい話

「含む」を除外と「含まない」を含むってそもそもどこの話?

含まない含む

この2つのことです。

上の画像が「含む」を除外、下の画像が「含まない」を含むの条件です。

数学っぽく考えるのであれば、「含む」を除外することと、「含まない」を含むことは同じ意味の文脈になります。

しかし、論理と集合の文脈の話ではなく、ここではGAの仕様の話なので分けて考えねばなりません。

集合

上記画像のように考えると少しわかりやすくなるかもしれません。

集合の考え方ならば同じ定義になりそうですが、GAでの考え方では、URLだったりの条件を前提に考えていきます。

 

では、なぜ違うのか?なにが違うのか?

例えば下記のような2つのセッションがあったとします。

 

A:「/aaa/」>離脱

B:「/aaa/」>TOPページ>離脱

 

この2つで両方除外されるのが、「含む」を除外している時

Aのみ該当するのが「含まない」を含むの時

 

ここまでで分かった方もいらっしゃると思いますが、セグメントにおける「含まない」という条件は、”その条件を含まない”ではなく、その条件を含まないすべてという条件なのです。

上記集合図の中では、「含まない」条件とは濃い青色の部分を含む条件というわけなのですよ。

 

セグメントを作成する際はこのような、色々な注意点があります。

本当にあっているのかなっていうことを考えながら分析を進めていきましょう!

 

今回はここまでにします。

ご精読ありがとうございました。

 

 

データベースって何だろう?その基本機能とは?

今回はデータベースって何だろう?というテーマです

データベースに関して書こうかなと思ったきっかけ

最近興味のある分野、というか勉強している分野がデータベースなのですが、そもそもなんでデータベースなの?というと、GAがデータベースそのものだからです。

ユーザーのログを集計して、、見たいデータが見られるツールがアクセス解析ツールなのですが、どういった仕組みでデータを集計しているのかな?仕組みが分かったうえでもっとできることがないかなと思ったのがきっかけですね。

では、データベースって何だろう?

データベースっていうのは、整理されているデータの集合です。

一番身近な例だとGoogle検索がまさしくデータベースを利用したサービスの最たるものだと思います。
とにかくいっぱいあるデータそのものをもっていて、検索窓にほしい情報のキーワードを入力することで、ほしい情報が手に入るわけです。

それらを活用してビジネスに生かしていく流れが結構前からあるわけですよね。
ビッグデータなんて言葉もデータベースの活用が活発になったからこそ生まれた言葉ですね。

余談も余談

データベースの起源は電話帳らしいです。

イメージとしては、下記のようなものだったと思います。

名前 電話番号 メールアドレス 住所
武藤遊戯 080-XXX-XXXX atem@hogehoge.co.jp 童実野町3丁目
城之内克也 080-XXX-XXXX bonkotu@hogegoe.co.jp 童実野町5丁目
海馬瀬人 080-XXX-XXXX hunsai@hogehoge.co.jp 海馬コーポレーション30F
  • 名前
  • 電話番号
  • メールアドレス
  • 住所

電話帳とはが登録されているデータベースということになりますね。

データベースの基本機能

データベースがあるだけでは、意味がありませんよね。

ではデータベースに備えてある機能を紹介します。それは大きく2つだけです。

  • 検索
  • 更新

の2つです。

検索とは

データベースの最も重要な機能は「検索」です。
欲しいと思ったデータを取り出すこと、これができないとたくさんデータがあったとて役には立ちませんね。

例えば、先程の電話帳の中から「童実野町」に住む人を検索すると、「遊戯」と「城之内」がヒットします。検索さえできれば、童実野町のデュエリストにダイレクトメールを送ることができます。

更新とは

「更新」の意味はデータベースを扱う上で3つあります。
それは。登録・修正・削除の3つです。

新規に「遊城十代」という人物を電話帳に登録し、「海馬瀬人」が「童実野町2丁目」に引っ越して来た時には住所変更しなくてはなりません。また、「城之内克也」と喧嘩別れしたのならば、電話帳から削除する必要がありますよね。

これらの登録・修正・削除のすべてひっくるめて「更新」なのです。

 

実はデータベースは他にも、同時実行制御や耐障害性、セキュリティの機能も備えています。データベースならではの定義でもない気がするので簡単に済ませたいと思います。

同時実行制御

例えば、遊戯と海馬が同時にデータベースにアクセスして、更新したときにどちらが優先されるかという話です。これは、状況によって変わると思いますが3パターンあります。

  1. 最初に開いた人が閉じるまでは、他の人がファイルを開くことができない
  2. 最初に開いた人が閉じるまでは、他の人は「読み取り専用」
  3. 開いた順序は関係なく最終更新が反映される

1、2はエクセルみたいな感じで、3はスプレッドシートみたいな感じだと思ってもらえば大丈夫です。

耐障害性

よく企業がデータをクラッシュさせることがありますよね。
洋はデータを守るための機能です。これの対策として2つあります。

  1. データの冗長化
  2. バックアップ

データも冗長化というのは、サーバーの台数を増やして、データを1か所ではなく複数に分けて保存することで、データの全滅を避けることです。

バックアップというのは、iPhoneとかパソコンと同じで、全く同じデータを別の場所に保管することです。

セキュリティ

これに関しては言わずもがなな気もします。

データベースの中には気密性の高い情報が含まれていることが多いですよね。
ですから、データを外部から守る機能のことです。

 

以上がデータベースの機能です。
今日はこの辺にしたいと思います。

ご精読ありがとうございました。