SQL Server JOIN で NULL 値を扱う：ベストプラクティス

2024-06-16

SQL Server JOIN における欠損値と外部結合の種類

欠損値 とは、データベースのカラムに値が入力されていない状態を指します。これは、データがまだ入力されていない、入力忘れ、削除されたなど、様々な理由で発生します。

JOIN 操作において、欠損値は結果に影響を与える可能性があります。具体的には、以下の 2 つの問題が発生します。

行の消失

INNER JOIN や LEFT JOIN のような内部結合の場合、結合条件を満たさない行は結果から除外されます。例えば、顧客テーブルと注文テーブルを顧客IDで結合する場合、注文履歴のない顧客は結果に含まれません。

誤った結合

欠損値同士の結合は、論理的に誤った結果につながる可能性があります。例えば、部署テーブルと従業員テーブルを部署IDで結合する場合、部署に所属していない従業員は、誤った部署に割り当てられる可能性があります。

これらの問題を解決するには、適切な種類の外部結合を使用する必要があります。

外部結合 には、以下の 3 種類があります。

LEFT JOIN: 左側のテーブルのすべての行を結果に含み、右側のテーブルから一致する行があれば結合します。一致する行がない場合は、NULL 値で埋め込まれます。

例：

顧客テーブル (customers) と注文テーブル (orders) を持つ場合、以下のいずれかの JOIN を使用して、すべての顧客と注文履歴を表示できます。

-- すべての顧客を表示。注文履歴のない顧客には NULL が表示されます。
SELECT c.*, o.*
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id;

-- すべての注文を表示。顧客情報がない注文には NULL が表示されます。
SELECT c.*, o.*
FROM customers c
RIGHT JOIN orders o ON c.customer_id = o.customer_id;

-- すべての顧客と注文を表示。顧客情報や注文履歴がない場合は NULL が表示されます。
SELECT c.*, o.*
FROM customers c
FULL OUTER JOIN orders o ON c.customer_id = o.customer_id;

補足:

欠損値の扱いは、データベース設計によっても影響を受けます。例えば、顧客IDが NULL の顧客レコードを許可しないという制約を設定することもできます。
複雑な JOIN 操作の場合は、サブクエリを使用する方が効率的な場合があります。

欠損値の適切な処理は、正確なクエリ結果を得るために重要です。上記の説明と例を参考に、状況に応じて適切な JOIN 種類を選択してください。

サンプルコード：顧客テーブルと注文テーブルの結合

顧客テーブル (customers)

customer_id	customer_name
1	田中太郎
2	佐藤次郎
3	鈴木花子

注文テーブル (orders)

order_id	customer_id	order_date	order_amount
1	1	2024-01-01	10000
2	2	2024-02-01	20000
3	3	2024-03-01	30000

LEFT JOIN を使用して、すべての顧客と注文履歴を表示する

SELECT c.*, o.*
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id;

結果

customer_id	customer_name	order_id	order_date	order_amount
1	田中太郎	1	2024-01-01	10000
2	佐藤次郎	2	2024-02-01	20000
3	鈴木花子	3	2024-03-01	30000
1	田中太郎	NULL	NULL	NULL
2	佐藤次郎	NULL	NULL	NULL

解説

このクエリは LEFT JOIN を使用しているため、顧客テーブルのすべての行が結果に含まれます。
注文テーブルに一致する行があれば、order_id、order_date、order_amount カラムの値が結合されます。
一致する行がない場合は、これらのカラムには NULL 値が埋め込まれます。

SELECT c.*, o.*
FROM customers c
RIGHT JOIN orders o ON c.customer_id = o.customer_id;

customer_id	customer_name	order_id	order_date	order_amount
1	田中太郎	1	2024-01-01	10000
2	佐藤次郎	2	2024-02-01	20000
3	鈴木花子	3	2024-03-01	30000
NULL	NULL	4	2024-04-01	40000
NULL	NULL	5	2024-05-01	50000

SELECT c.*, o.*
FROM customers c
FULL OUTER JOIN orders o ON c.customer_id = o.customer_id;

customer_id	customer_name	order_id	order_date	order_amount
1	田中太郎	1	2024-01-01	10000
2	佐藤次郎	2	2024-02-01	20000
3	鈴木花子	3	2024-03-01	30000
1	田中太郎	NULL	NULL	NULL
2	佐藤次郎	NULL	NULL	NULL
NULL	NULL	4	2024-04-01	40000
NULL	NULL	5

SQL Server JOIN における欠損値の処理：代替方法

ISNULL 関数は、引数が NULL の場合は別の値を返す関数です。

SELECT c.*, ISNULL(o.order_date, 'なし') AS order_date_str
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id;

customer_id	customer_name	order_date_str
1	田中太郎	2024-01-01
2	佐藤次郎	2024-02-01
3	鈴木花子	2024-03-01
1	田中太郎	なし
2	佐藤次郎	なし

このクエリは LEFT JOIN を使用しており、order_date カラムが NULL の場合は、文字列 "なし" が表示されます。

COALESCE 関数は、引数のうち最初の NULL 以外の値を返します。

SELECT c.*, COALESCE(o.order_date, '2000-01-01') AS order_date
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id;

customer_id	customer_name	order_date
1	田中太郎	2024-01-01
2	佐藤次郎	2024-02-01
3	鈴木花子	2024-03-01
1	田中太郎	2000-01-01
2	佐藤次郎	2000-01-01

CASE 式は、条件に応じて異なる値を返す式です。

SELECT c.*,
  CASE WHEN o.order_date IS NULL THEN 'なし'
       ELSE o.order_date
  END AS order_date_str
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id;

customer_id	customer_name	order_date_str
1	田中太郎	2024-01-01
2	佐藤次郎	2024-02-01
3	鈴木花子	2024-03-01
1	田中太郎	なし
2	佐藤次郎	なし

サブクエリを使用して、欠損値を処理することもできます。

SELECT c.*, o.order_date
FROM customers c
LEFT JOIN (
  SELECT order_id,
         CASE WHEN order_date IS NULL THEN 'なし' ELSE order_date END AS order_date
  FROM orders
) AS o ON c.customer_id = o.customer_id;