無料スクリプト配布のPHP.TO   PHPの実用的なtips PHPマニュアル MySQLマニュアル Apacheマニュアル PostgreSQLマニュアル マニュアル検索    

CREATE INDEX

名前

CREATE INDEX -- 新しいインデックスを定義する

概要

CREATE [ UNIQUE ] INDEX [ CONCURRENTLY ] [ 

name

 ] ON 

table_name

 [ USING 

method

 ]
    ( { 

column_name

 | ( 

expression

 ) } [ COLLATE 

collation

 ] [ 

opclass

 ] [ ASC | DESC ] [ NULLS { FIRST | LAST } ] [, ...] )
    [ WITH ( 

storage_parameter

 = 

value

 [, ... ] ) ]
    [ TABLESPACE 

tablespace_name

 ]
    [ WHERE 

predicate

 ]

説明

CREATE INDEX は、指定したリレーションの指定した列(複数可)に対するインデックスを作ります。 リレーションとしてテーブルまたはマテリアライズドビューを取ることができます。 インデックスは主にデータベースの性能を向上するために使われます (しかし、インデックスの不適切な使用は性能の低下につながる可能性があります)。

インデックスのキーフィールドは、列名、または括弧に囲まれた式として指定されます。 インデックスメソッドが複数列に対するインデックスをサポートする場合は、複数のフィールドを指定できます。

インデックスのフィールドとして、テーブル行の1つ以上の列の値を計算する式を指定できます。 この機能は、元のデータに何らかの変換を加えた値を基とするデータへの高速なアクセスを行う手段として使用することができます。 例えば、 upper(col) という計算に基づくインデックスがあれば、 WHERE upper(col) = 'JIM' 句ではインデックスを使用することができます。

PostgreSQL はB-tree、ハッシュ、GiST、SP-GiST、GINのインデックスメソッドを用意しています。 ユーザが独自にインデックスメソッドを定義することもできますが、これはかなり複雑です。

WHERE 句が存在する場合、 部分インデックス が作成されます。 部分インデックスは、テーブルの一部、通常は、テーブルの中でよりインデックスが有用な部分のみのエントリを持つインデックスです。 例えば、支払済みの注文と未支払の注文を情報として持つテーブルがあり、テーブル全体における未支払の注文の割合が小さく、かつ、頻繁に使用される場合、未支払の注文のみにインデックスを作成することで性能を向上できます。 部分インデックスのその他の利用方法として、 UNIQUE 付きの WHERE を使用して、テーブルの一部に一意性を強制する例が考えられます。 詳細は 項11.8 を参照してください。

WHERE 句内の式では、元となるテーブルの列のみを参照できます。 しかし、インデックスを付加する列だけではなく、全ての列を使用することができます。 また、現在、副問い合わせと集約式については、 WHERE で使用することができません。 同一の制限は、式で表されたインデックスのフィールドにも適用されます。

インデックスの定義で使用される全ての関数と演算子は、 "不変" (immutable)でなければなりません。 つまり、結果は入力引数にのみに依存し、(他のテーブルの内容や現時刻などの)外部からの影響を受けてはなりません。 この制限によって、インデックスの動作が十分定義されていることが保証されます。 インデックス式や WHERE 句にユーザ定義の関数を使用する場合、関数を作成する際、IMMUTABLE(不変)オプションを付けることを忘れないでください。

パラメータ

UNIQUE

インデックスを(既にデータがある状態で)作成する時、テーブルにデータを追加する時に、テーブル内の値が重複していないかを検査します。 重複エントリを生じるデータの挿入または更新はエラーとなります。

CONCURRENTLY

このオプションを使用すると、 PostgreSQL は、対象テーブルに対する同時挿入、更新、削除を防止するようなロックを獲得せずにインデックスを作成します。 通常のインデックス作成処理では、完了するまで対象テーブルへの書き込みはロックされます(読み取りはロックされません)。 このオプションを使用する際に注意しなければならない点が複数あります。 インデックスの同時作成 を参照してください。

name

作成するインデックスの名前です。 この名前には、スキーマ名を含めることはできません。 インデックスは、常にその親テーブルと同じスキーマに作成されます。 この名前を省略すると、 PostgreSQL はその親テーブルの名前とインデックス付けされる列名に基づいた適切な名前を選びます。

table_name

インデックスを作成するテーブルの名前です(スキーマ修飾名の場合もあります)。

method

使用するインデックスメソッドの名前です。 btree hash gist spgist gin から選択します。 デフォルトのメソッドは btree です。

column_name

テーブルの列の名前です。

expression

テーブル上の1つ以上の列を使用した式です。 通常この式は、構文で示した通り括弧で囲む必要があります。 しかし、式が関数呼び出し形式になっている場合は括弧を省略することができます。

collation

インデックスで使用する照合順序の名前です。 デフォルトではインデックスはインデックス付け対象の列で宣言された照合順序またはインデックス付け対象の式の結果照合順序を使用します。 デフォルト以外の照合順序を使用する式を含む問い合わせで、デフォルト以外の照合順序を持つインデックスが有用になるかもしれません。

opclass

演算子クラスの名前です。詳細は下記を参照してください。

ASC

(デフォルトの)正方向のソート順を指定します。

DESC

逆方向のソート順を指定します。

NULLS FIRST

NULLを非NULLより前にソートすることを指定します。 これは DESC が指定された場合のデフォルトです。

NULLS LAST

NULLを非NULLより後にソートすることを指定します。 これは DESC が指定されない場合のデフォルトです。

storage_parameter

インデックス固有の格納パラメータの名前です。 インデックス格納パラメータ を参照してください。

tablespace_name

インデックスを生成するテーブル空間です。 指定されなかった場合、 default_tablespace 、もし一時テーブル上のインデックスであれば、 temp_tablespaces が考慮されます。

predicate

部分インデックス用の制約式です。

インデックス格納パラメータ

省略可能な WITH 句では、インデックスに対し 格納パラメータ を指定します。 インデックスメソッドはそれぞれ固有の設定可能な格納パラメータを持ちます。 B-tree、ハッシュ、GiSTおよびSP-GiSTといったインデックスはすべて以下の1つのパラメータを受け付けます。

FILLFACTOR

インデックス用のフィルファクタは割合(パーセント)で、インデックスメソッドがインデックスページをまとめ上げる時にどの程度ページを使用するかを決定するものです。 B-treeでは、リーフページは初期インデックス構築時と右側(新しい最大キー値を追加する方向)にインデックスを拡張する時にこの割合分ページを使用します。 その後ページすべてが完全に使用されると、インデックスの効果が緩やかに劣化するように分割されます。 B-treeのデフォルトのフィルファクタは90ですが、10から100までの任意の整数値を設定することができます。 テーブルの変化がほとんどない場合、100が最善でインデックスの物理サイズが最小化できます。 更新が非常に多い場合は、より小さなフィルファクタを設定することで、ページ分割の頻度を少なくすることができます。 この他のインデックスメソッドでは、フィルファクタをおおよそは同じですが、異なる意味で使用します。 メソッドによってフィルファクタのデフォルト値は異なります。

GiSTインデックスではさらに以下のパラメータを受け付けます。

BUFFERING

項55.3.1 で説明するバッファリング構築技術をインデックスを構築する時に使用するかどうかを決定します。 OFF で無効に、 ON で有効になります。 さらに AUTO と指定すると、最初は無効ですが、 インデックスサイズが effective_cache_size に達した後はその場で有効になります。 デフォルトは AUTO です。

GINインデックスでは以下の異なるパラメータを受け付けます。

FASTUPDATE

この設定は 項57.3.1 で説明する高速更新技法を使用するかどうかを制御します。 これは論理値パラメータであり、 ON は高速更新を有効に、 OFF は無効にします。 ( 項18.1 の説明のように、 ON OFF の別記載も可能です。) デフォルトは ON です。

注意: ALTER INDEX を使用して FASTUPDATE を無効にすることにより、今後の挿入は待機中のインデックス項目リストに入らないようになります。 しかし、このコマンド自体はこれまでの項目を吐き出しません。 確実に待機中のリストを空にするためには、続いてテーブルを VACUUM する方が良いでしょう。

インデックスの同時作成

インデックスの作成が、通常のデータベース操作に影響を与えることがあります。 通常 PostgreSQL は、対象テーブルに対する書き込みをロックしてから、対象テーブルを一度スキャンして全体をインデックス付けします。 他のトランザクションはテーブルを読み取ることはできますが、対象テーブル内の行を挿入、更新、削除しようとすると、インデックス作成が完了するまでブロックされます。 活発な運用状態のデータベースシステムの場合、これは重大な影響を与えます。 非常に大規模なテーブルに対するインデックス作成は何時間もかかることがあり得ます。 また小規模なテーブルであっても、インデックス作成により、運用状態のシステムでは受け入れられない期間、書き込みロックがかかる可能性があります。

PostgreSQL は書き込みをロックしないインデックス作成もサポートしています。 CREATE INDEX CONCURRENTLY オプションをつけることでこの方式が行われます。 このオプションを使うと、 PostgreSQL はテーブルを2回スキャンしなければなりません。 さらに、潜在的にそのインデックスを使用する可能性がある、実行中のすべてのトランザクションが終わるまで待機しなければなりません。 したがって、この方式は通常の方式よりも総作業時間がかかり、また、完了するまでの時間が非常に長くなります。 しかし、インデックス作成中に通常の操作を行い続けることができますので、この方式は運用環境での新規インデックス作成に有用です。 もちろん、インデックス作成によりCPUや入出力に負荷がかかりますので、他の操作が低速になる可能性があります。

同時実行インデックス構築では実際、第一トランザクションでシステムカタログに登録され、第二以降のトランザクションで2つのテーブルスキャンが起こります。 2回目のテーブルスキャンが始まった後にそのテーブルを参照するのみのトランザクションであったとしても、2回目のテーブルスキャンが始まった時に有効なトランザクションは、その完了まで、同時実行インデックス作成をブロックする可能性があります。 同時実行インデックス作成は、 項47.59 節で概要を示す方法を用いて、古いトランザクションが完了することを直列的に待機します。

たとえば一意性インデックスにおける一意性違反など、テーブルスキャン中に問題が発生すると、 CREATE INDEX は失敗しますが、 "無効な" インデックスが残ってしまいます。 こうしたインデックスは完全ではない可能性がありますので、問い合わせの際には無視されます。 しかし、更新時にオーバーヘッドがかかります。 psql \d コマンドでは、こうしたインデックスを INVALID として報告します。

postgres=# \d tab
       Table "public.tab"
 Column |  Type   | Modifiers 
--------+---------+-----------
 col    | integer | 
Indexes:
    "idx" btree (col) INVALID

こうした場合の推奨復旧方法は、インデックスを削除し、再度 CREATE INDEX CONCURRENTLY を実行することです。 (他にも REINDEX を使用したインデックスの再作成という方法もあります。 しかし、 REINDEX は同時作成をサポートしていませんので、この方法は魅力がありません。)

この他に一意性インデックスを同時作成する場合の注意事項があります。 2回目のテーブルスキャンが始まる時点で、他のトランザクションに対する一意性制約が既に有効になっているという点です。 これは、インデックスが使用できるようになる前やインデックス作成が最終的に失敗したとしても、制約違反が他のトランザクションで報告されてしまうことを意味します。 また、2回目のスキャン中に失敗した後も、 "無効な" インデックスによる一意性制約は強制され続けます。

式インデックスや部分インデックスの同時作成もサポートされています。 式の評価中にエラーが発生した場合も、上で説明した一意性制約違反と同様な状況が発生します。

同一テーブルに対する通常のインデックス作成処理は複数並行して行うことができます。 しかし、あるテーブルに対するインデックスの同時作成は一度に1つしか行うことができません。 また、どの場合でもインデックス作成中はテーブルスキーマの変更はできません。 この他に、通常の CREATE INDEX コマンドはトランザクションブロック内で実行させることができますが、 CREATE INDEX CONCURRENTLY は実行させることができないという相違点があります。

注釈

インデックスが、どのような時に使用され、どのような時に使用されないか、また、どのような場合に有用かといった情報については 第11章 を参照してください。

注意

ハッシュインデックス操作は現在WALに記録されません。 このためハッシュインデックスは、データベースクラッシュの後未書き込みな変更があれば、 REINDEX を用いて再構築しなければならない可能性があります。 また、ハッシュインデックスの変更は最初のベースバックアップ以降のストリーミングまたはファイルベースのレプリケーションでは複製されません。 ですので、その後にそのインデックスを使用する問い合わせに対して間違った答えが返ります。 このような理由から現在ハッシュインデックスの使用を勧めません。

現在は、B-tree、GiST、GINインデックスメソッドのみが、複数列に対するインデックスをサポートしています。 指定できる列は、デフォルトでは32個までです(この制限は PostgreSQL 構築の際に変更できます)。 現在、B-treeのみが一意性インデックスをサポートしています。

演算子クラス は、インデックスのそれぞれの列に指定することができます。 演算子クラスは、その列のインデックスが使う演算子を識別します。 例えば、4バイト整数に対するB-treeインデックスには、 int4_ops クラスを使います。 この演算子クラスには、4バイト整数の比較関数が含まれています。 実際の使用では、通常、列のデータ型のデフォルト演算子クラスで十分です。 演算子クラスを保持する主な理由は、データ型の中には有意な順序を2つ以上持つものがあるかもしれないからです。 例えば、絶対値または実数部のどちらかを使って複素数のデータ型をソートしたい場合がありえます。 これを実現するには、データ型として2つの演算子クラスを定義し、インデックスを作る時に適切なクラスを選択します。 演算子クラスについての詳細は、 項11.9 項35.14 を参照してください。

順序付きスキャンをサポートするインデックスメソッド(現時点ではB-Treeのみ)では、省略可能な ASC DESC NULLS FIRST NULLS LAST 句を指定し、インデックスのソート順を変更させることができます。 順序付きインデックスは正方向にも逆方向にもスキャンすることができますので、単一列に対する DESC インデックスは通常は有用ではありません。 このソート順序はすでに通常のインデックスを使用して実現できます。 これらのオプションの価値は、 SELECT ... ORDER BY x ASC, y DESC などの順序指定が混在する問い合わせによって要求されるソート順に一致する、複数列に対するインデックスを作成できる点です。 NULLS オプションは、ソート処理を中断するインデックスに基づいた問い合わせにおける "NULLのソート順を低くする" 動作をサポートする必要がある場合に有用です。 デフォルトの動作は "NULLのソート順を高くする" です。

ほとんどのインデックスメソッドにおいて、インデックス作成速度は maintenance_work_mem の設定に依存します。 より大きな値を設定すると、マシンをスワップ状態にしてしまわないように実際に使用できるメモリ量を超えないようにしている限り、インデックス作成が必要となる回数を減少します。 ハッシュインデックスでは、 effective_cache_size の値もインデックス作成時間に影響を与えます。 PostgreSQL は、推定インデックスサイズが effective_cache_size より大きいか小さいかによって、2つのハッシュインデックス作成方法の内どちらかを使用します。 最善の結果を得るために、このパラメータが利用可能なメモリを反映した値に設定されていることを確認してください。 また、 maintenance_work_mem effective_cache_size の和が、マシンのRAM容量から他のプログラムで必要とされる容量を差し引いた容量より小さくなるよう注意してください。

インデックスを削除するには、 DROP INDEX を使用してください。

以前の PostgreSQL にはR-treeインデックスメソッドがありました。 GiSTメソッドに比べて大きな利点がありませんでしたので、このメソッドは削除されました。 古いデータベースからGiSTへの変換を簡単にするため、 USING rtree が指定された場合、 CREATE INDEX USING gist と解釈します。

films テーブルの title 列にB-treeインデックスを作成します。

CREATE UNIQUE INDEX title_idx ON films (title);

大文字小文字を区別しない検索が効率的になるように、 lower(title) 式に対してインデックスを作成します。

CREATE INDEX ON films ((lower(title)));

(この例では、インデックス名を省略することを選びました。 このためシステムが名前、通常は films_lower_idx という名前を選ぶことになるでしょう。)

デフォルト以外の照合順序でインデックスを作成します。

CREATE INDEX title_idx_german ON films (title COLLATE "de_DE");

デフォルト以外のNULLのソート順を指定したインデックスを作成します。

CREATE INDEX title_idx_nulls_low ON films (title NULLS FIRST);

デフォルト以外のフィルファクタを持つインデックスを作成します。

CREATE UNIQUE INDEX title_idx ON films (title) WITH (fillfactor = 70);

高速更新を無効にして GIN インデックスを作成します。

CREATE INDEX gin_idx ON documents_table USING gin (locations) WITH (fastupdate = off);

films テーブル上に code 列に対するインデックスを作成します。 また、このインデックスを indexspace テーブル空間内に生成します。

CREATE INDEX code_idx ON films (code) TABLESPACE indexspace;

変換関数の結果に対するbox操作を効率的に使用できるようにpoint属性にGiSTインデックスを作成します。

CREATE INDEX pointloc
    ON points USING gist (box(location,location));
SELECT * FROM points
    WHERE box(location,location) && '(0,0),(1,1)'::box;

対象テーブルへの書き込みをロックせずにインデックスを作成します。

CREATE INDEX CONCURRENTLY sales_quantity_index ON sales_table (quantity);

互換性

CREATE INDEX PostgreSQL の拡張です。 標準SQLにはインデックスについての規定はありません。

関連項目

ALTER INDEX , DROP INDEX

powered by SEO.CUG.NET