今回の記事は応用情報のデータベース分野の用語と頻出SQL文をまとめた記事です。データベース分野は午前では必須ですし、午後も図とよく問われるSQLを押さえておけば簡単ですので是非押さえておきましょう。押さえておく範囲は狭いですが、午前午後両方に出てくるお得な分野ですので、応用情報を受ける方は是非参考にしてみてください。
データベース用語まとめ
データベースの用語は基本的に午前試験で問われます。午後試験のデータベース分野では用語が問われている回は私が実施した過去15回分程度にはなかったような気がします。
午前の用語で聞かれるのは下記ではないでしょうか?
- データベースの性質
- スキーマ構造
- 正規化
- ビックデータ
もちろんSQLも毎回出題されていますので、SQLに関しては次の章にまとめております。では順番に用語をご紹介していきます。
データベースの性質
ACID
データベースのトランザクション処理を行う上で必要不可欠とされる4つの性質(Atomicity・Consistency・Isolation・Durability)の頭文字を並べた言葉。
- 原子性:トランザクションはすべて実行されるか一つも実行されない状態。
- 一貫性:トランザクション前後で整合性が保たれる
- 独立性:トランザクションは独立している
- 永続性:トランザクションで実行されたデータベース操作は永続敵である。(耐久性ともいう)
スキーマ構造
概念スキーマ
データベース化対象の業務とデータの内容を論理的なデータモデルとして表現したもの。概念スキーマを記述するために記号系にはリレーショナルモデルの他にも、ネットワークモデル、階層型モデルなどがある。リレーショナルモデルではE-R図の作成、表定義、表の正規化が概念スキーマに相当する。
外部スキーマ
概念スキーマで定義されたデータモデル上に利用者ごとの目的に応じた見方を表現したもの。リレーショナルモデルのビューやネットワークモデルのサブスキーマが外部スキーマに相当する。
内部スキーマ
概念スキーマで定義されたデータモデルを記憶装置上にどのような形式で格納するかを表現したもの。ファイル編成やインデックスの設定などが内部スキーマに相当する。
スタースキーマ
複数の外部参照を1つ(あるいはごく少数)のテーブルに集約するスキーマ。ファクトテーブル(中心)とディメンションテーブル(その他で構成。
データディクショナリ
データディクショナリ(DD)は、データベースのメタデータやデータ定義情報を効率よく管理する情報の保管庫。他のデータベースと同じく表とビューで構成されていて次のような情報が格納されています。(概念スキーマ、外部スキーマ、内部スキーマとそれらの変換定義情報など)
正規化
第1正規形
行に繰り返しがない。
第2正規形
第1正規形を満たし、主キーに部分関数従属する属性が存在しない状態。
第3正規形
社員番号→所属部門コード,所属部門コード→所属部門名というように主キーに対して推移的に非キー属性の値が決まるものがある場合で、下記のような主キーに対しての推移的な関数従属を排除するためにその属性を別表に移したもののことを第3正規形という。
(社員番号,氏名,所属部門コード)
(所属部門コード,所属部門名)
第2正規形を満たし、かつ、主キーからの推移的関数従属が存在しない状態である。
ビックデータ
ビックデータ
- データマイニング
大量のデータを分析し,単なる検索だけでは分からない隠れた規則や相関関係を見つけ出す - データマート
データウェアハウスに格納されたデータから特定の用途に必要なデータだけを取り出し,構築する。 - OLAP(Online Analytical Processing)
データウェアハウスやデータマートからデータを取り出し,多次元分析を行う。
スライシング(多次元データベースをある断面で切り取って2次元の表にする)
ダイシング(スライシングは多次元データベースの中にある縦横軸を指定して、2次元の表にする)
ドリリング(多次元データベースの一部を集計する) - OLTP
基幹システムなどのリアルタイム処理の手法です。ユーザーによるアクションへの即時対応が目的 - データレイク
必要に応じて加工するために,データを発生したままの形で格納する。
Hadoop(ハドゥープ)
ビッグデータの取り扱いを目的とした分散処理のフレームワーク。
その他
NOSQL
- ドキュメント指向DB
データ項目の値として階層構造のデータをドキュメントとしてもつことができる。また,ドキュメントに対しインデックスを作成することもできる。 - グラフ指向DB
ノード,リレーション,プロパティで構成され,ノード間をリレーションでつないで構造化する。ノード及びリレーションはプロパティをもつことができる。 - キーバリューストア(KVS)
一つのキーに対して一つの値をとる形をしている。値の型は定義されていないので,様々な型の値を格納することができる。 - カラム指向DB
一つのキーに対して複数の列をとる形をしている。関係データベースとは異なり,列の型は固定されていない。
導出表
1つ以上の基礎となる実表(DBに実データを持つ表)から関係演算・集合演算といったSQL問合せによって作成される仮想的な表全般を指します。
is-a(汎化-特化)関係
is-a(汎化-特化)関係「動物-犬」や「家電-テレビ」などのように「…は、○○である」で表される関係。
part-of(集約-分解)関係
part-of(集約-分解)関係「コンピュータ-CPU」や「自転車-サドル」などのように「…は、○○の一部である」で表される関係。
ネットワークモデル
ネットワークモデルは、多対多のレコード関係を表現するのに適している。親は複数の子を持つことができ、子も複数の親を持つことができるという関係を網状に表すネットワークモデルの説明です。
階層モデル
データを木構造で構成し、あるレコードには1つの親レコードと複数の子レコードが関連をもつモデルです。親と子は1対多の関係で関連付けられます。
関係モデル
関係モデルは、データを二次元の表として管理するモデルです。複数の表は属性の値で関連付けられます。
ボイス・コッド正規形
ボイス・コッド正規形は,関係モデルで使用される形式である。ボイス・コッド正規形は第3正規形の条件を満たしつつ、すべての列が主キーに完全関数従属で、他に完全関数従属関係がないものを言います。
2相コミットプロトコル
トランザクションを他のサイトに更新可能かどうかを確認する第1相と、更新を確定する第2相の2つのフェーズに分け、各サイトのトランザクションをコミットもロールバックも可能な中間状態にしてから、全サイトがコミットできる場合だけトランザクションをコミットする方法。原子性・一貫性を保証。
コーパス
自然言語の文章を大量に収集したデータベース。
ライブマイグレーション
仮想サーバを停止させずに物理サーバ間を仮想サーバに移動することが可能。
ペトリネット
ペトリネット(Petri Net)は、プレース、トランジション、トークンの3つの要素を使用した有向グラフでシステムの動作を記述する図法です。
CMDB(Configuration Management Database)
構成管理データベースのことで、ITサービスの提供に必要な「資産」と「構成」の情報を一元管理するデータベースです。
以上で今回の記事は終了です。随時更新していきます。他にも応用情報の分野ごとのまとめ記事を作成しているので是非参考にしてみてください。
コメント