logblog

分析とかデータベースとかの関心ごと

データベースって何だろう?その基本機能とは?

今回はデータベースって何だろう?というテーマです

データベースに関して書こうかなと思ったきっかけ

最近興味のある分野、というか勉強している分野がデータベースなのですが、そもそもなんでデータベースなの?というと、GAがデータベースそのものだからです。

ユーザーのログを集計して、、見たいデータが見られるツールがアクセス解析ツールなのですが、どういった仕組みでデータを集計しているのかな?仕組みが分かったうえでもっとできることがないかなと思ったのがきっかけですね。

では、データベースって何だろう?

データベースっていうのは、整理されているデータの集合です。

一番身近な例だとGoogle検索がまさしくデータベースを利用したサービスの最たるものだと思います。
とにかくいっぱいあるデータそのものをもっていて、検索窓にほしい情報のキーワードを入力することで、ほしい情報が手に入るわけです。

それらを活用してビジネスに生かしていく流れが結構前からあるわけですよね。
ビッグデータなんて言葉もデータベースの活用が活発になったからこそ生まれた言葉ですね。

余談も余談

データベースの起源は電話帳らしいです。

イメージとしては、下記のようなものだったと思います。

名前 電話番号 メールアドレス 住所
武藤遊戯 080-XXX-XXXX atem@hogehoge.co.jp 童実野町3丁目
城之内克也 080-XXX-XXXX bonkotu@hogegoe.co.jp 童実野町5丁目
海馬瀬人 080-XXX-XXXX hunsai@hogehoge.co.jp 海馬コーポレーション30F
  • 名前
  • 電話番号
  • メールアドレス
  • 住所

電話帳とはが登録されているデータベースということになりますね。

データベースの基本機能

データベースがあるだけでは、意味がありませんよね。

ではデータベースに備えてある機能を紹介します。それは大きく2つだけです。

  • 検索
  • 更新

の2つです。

検索とは

データベースの最も重要な機能は「検索」です。
欲しいと思ったデータを取り出すこと、これができないとたくさんデータがあったとて役には立ちませんね。

例えば、先程の電話帳の中から「童実野町」に住む人を検索すると、「遊戯」と「城之内」がヒットします。検索さえできれば、童実野町のデュエリストにダイレクトメールを送ることができます。

更新とは

「更新」の意味はデータベースを扱う上で3つあります。
それは。登録・修正・削除の3つです。

新規に「遊城十代」という人物を電話帳に登録し、「海馬瀬人」が「童実野町2丁目」に引っ越して来た時には住所変更しなくてはなりません。また、「城之内克也」と喧嘩別れしたのならば、電話帳から削除する必要がありますよね。

これらの登録・修正・削除のすべてひっくるめて「更新」なのです。

 

実はデータベースは他にも、同時実行制御や耐障害性、セキュリティの機能も備えています。データベースならではの定義でもない気がするので簡単に済ませたいと思います。

同時実行制御

例えば、遊戯と海馬が同時にデータベースにアクセスして、更新したときにどちらが優先されるかという話です。これは、状況によって変わると思いますが3パターンあります。

  1. 最初に開いた人が閉じるまでは、他の人がファイルを開くことができない
  2. 最初に開いた人が閉じるまでは、他の人は「読み取り専用」
  3. 開いた順序は関係なく最終更新が反映される

1、2はエクセルみたいな感じで、3はスプレッドシートみたいな感じだと思ってもらえば大丈夫です。

耐障害性

よく企業がデータをクラッシュさせることがありますよね。
洋はデータを守るための機能です。これの対策として2つあります。

  1. データの冗長化
  2. バックアップ

データも冗長化というのは、サーバーの台数を増やして、データを1か所ではなく複数に分けて保存することで、データの全滅を避けることです。

バックアップというのは、iPhoneとかパソコンと同じで、全く同じデータを別の場所に保管することです。

セキュリティ

これに関しては言わずもがなな気もします。

データベースの中には気密性の高い情報が含まれていることが多いですよね。
ですから、データを外部から守る機能のことです。

 

以上がデータベースの機能です。
今日はこの辺にしたいと思います。

ご精読ありがとうございました。