SQLでカウントする前に知っておくべきこと： COUNT(*)とCOUNT(column-name)の基礎知識

2024-06-10

SQLにおける「COUNT(*)」と「COUNT(column-name)」：違いと使い分け

SQLにおけるCOUNT関数には、COUNT(*)とCOUNT(column-name)という2つの形式が存在します。どちらも行数をカウントする関数ですが、重要な違いがあります。この解説では、それぞれの機能と使い分けを分かりやすく説明します。

COUNT(*)

COUNT(*)は、テーブル内のすべての行数をカウントします。NULL値を含むすべての行がカウントされます。

例：

SELECT COUNT(*) FROM customers;

結果：

COUNT(*)
-------
100

この例では、customersテーブルに100行存在するため、その数がカウントされています。

COUNT(column-name)

COUNT(column-name)は、指定された列にNULL値以外の値を持つ行数をカウントします。NULL値を含む行はカウントされません。

SELECT COUNT(name) FROM customers;

COUNT(name)
----------
95

一般的には、以下の状況でCOUNT(*)とCOUNT(column-name)を使い分けます。

すべての行数をカウントしたい場合: COUNT(*)を使用します。
NULL値を除いた行数をカウントしたい場合: COUNT(column-name)を使用します。

性能

COUNT(*)は、COUNT(column-name)よりも高速に実行される傾向があります。これは、COUNT(*)はテーブル内のすべての行をカウントするだけなのに対し、COUNT(column-name)は各行の列値をチェックする必要があるためです。

まとめ

COUNT(*)とCOUNT(column-name)は、それぞれ異なる用途で使用されます。それぞれの機能と使い分けを理解し、適切な関数を選択することが重要です。

補足

COUNT(*)は、テーブルにインデックスがない場合、パフォーマンスが低下する可能性があります。
COUNT(1)は、COUNT(*)と同等の機能を持つ関数です。
COUNT(DISTINCT column-name)は、指定された列の重複なしの値を持つ行数をカウントします。

customersテーブル

このサンプルコードでは、customersという名前のテーブルを使用します。このテーブルには、顧客情報が格納されています。

CREATE TABLE customers (
  id INT PRIMARY KEY AUTO_INCREMENT,
  name VARCHAR(255) NOT NULL,
  email VARCHAR(255) UNIQUE,
  age INT,
  created_at DATETIME DEFAULT CURRENT_TIMESTAMP
);

すべての行数をカウント

以下のクエリは、customersテーブル内のすべての行数をカウントします。

SELECT COUNT(*) FROM customers;

COUNT(*)
-------
100

この結果から、customersテーブルには100行のデータが存在することが分かります。

NULL値を除いた行数をカウント

SELECT COUNT(name) FROM customers;

COUNT(name)
----------
95

特定の列にNULL値以外を持つ行数をカウント

SELECT COUNT(age) FROM customers WHERE age >= 20;

COUNT(age)
---------
75

上記のサンプルコードは、MySQLデータベースで使用することを想定しています。他のデータベースシステムを使用している場合は、構文が多少異なる場合があります。
サンプルコードはあくまでも例であり、実際の状況に合わせて変更する必要があります。

Using the GROUP BY clause

The GROUP BY clause can be used to group rows in a table based on one or more columns. The COUNT function can then be used to count the number of distinct values in each group. For example, the following query counts the number of distinct customer names in the customers table:

SELECT COUNT(DISTINCT name) FROM customers;

Using the DISTINCT keyword

SELECT COUNT(DISTINCT name) FROM customers;

Using a subquery

SELECT COUNT(DISTINCT name)
FROM (SELECT name FROM customers);

Using a window function

SELECT COUNT(DISTINCT name) OVER (PARTITION BY ROW_NUMBER() OVER (ORDER BY name) DIV 10)
FROM customers;

A user-defined function (UDF) can be used to implement custom counting logic. The UDF can then be used to count the number of distinct values in a column. For example, the following UDF counts the number of distinct values in a column:

CREATE FUNCTION count_distinct(column_name VARCHAR(255))
RETURNS INT
BEGIN
  DECLARE distinct_values INT;
  DECLARE done INT DEFAULT 0;
  DECLARE row_value VARCHAR(255);
  DECLARE previous_value VARCHAR(255);

  SET distinct_values = 0;

  REPEAT
    SELECT column_name INTO row_value
    FROM customers
    WHERE done = 0
    ORDER BY column_name
    LIMIT 1;

    IF row_value IS NULL THEN
      SET done = 1;
    ELSE
      IF previous_value IS NULL OR row_value <> previous_value THEN
        SET distinct_values = distinct_values + 1;
        SET previous_value = row_value;
      END IF;

      SET done = done + 1;
    END IF;
  UNTIL done = 1;

  RETURN distinct_values;
END;

The UDF can then be used to count the number of distinct customer names in the customers table:

SELECT count_distinct('name') FROM customers;

The best method for counting distinct values in SQL depends on the specific requirements of the query. The GROUP BY clause is a good choice for counting distinct values in groups. The DISTINCT keyword is a good choice for selecting only distinct values. Subqueries are a good choice for filtering rows before counting distinct values. Window functions are a good choice for counting distinct values in windows of rows. UDFs are a good choice for implementing custom counting logic.

I hope this helps! Let me know if you have any other questions.

sql count