Агрегатные функции

Агрегатные функции выполняют вычисление на наборе значений и возвращают одиночное значение. Агрегатные функции, за исключением COUNT, не учитывают значения NULL. Агрегатные функции часто используются совместно с предложением GROUP BY.

Агрегатные функции могут быть использованы в качестве выражений только в следующих случаях:

Список выбора инструкции SELECT (вложенный или внешний запрос);
Предложение HAVING.

Синтаксис агрегатных функций

<aggregate_function> ::=
  aggragate_function ([ALL | DISTINCT] <expr>)
  [FILTER (WHERE <condition>)]

Агрегатные функции также могут использоваться как оконные с предложением OVER (). Подробнее смотри в Оконные (Аналитические) функции.

Предложение `FILTER`

Предложение FILTER расширяет агрегатные функции дополнительным предложением WHERE. Если используется предложение FILTER, то результат агрегата строится только из строк, которые также удовлетворяют условию в дополнительном предложении WHERE.

Как правило, предложение фильтра может быть реализовано с использованием выражения CASE внутри агрегатной функции: условие фильтра должно быть помещено в предложение WHEN, значение, которое должно быть агрегировано в предложение THEN. Поскольку агрегатные функции обычно пропускают значения NULL, неявное предложение ELSE NULL достаточно, чтобы игнорировать не подходящие под условия фильтрации строки. Следующие два выражения эквивалентны:

SUM(<expression>) FILTER(WHERE <condition>)

SUM(CASE WHEN <condition> THEN <expression> END)

Для COUNT(*) этот пример выглядит иначе, потому что выражение “*” не может быть использовано в предложении THEN. Вместо этого обычно используется любое константное значение не равное NULL.

COUNT(*) FILTER(WHERE <condition>)

SUM(CASE WHEN <condition> THEN 1 END)

Примеры `FILTER`

Example 1. Использование предложения FILTER

SELECT
  invoice_year,
  SUM(revenue) FILTER (WHERE invoice_month = 1) AS jan_revenue,
  SUM(revenue) FILTER (WHERE invoice_month= 2) AS feb_revenue,
  ...
  SUM(revenue) FILTER (WHERE invoice_month = 12) AS dec_revenue
FROM (
  SELECT
    EXTRACT(YEAR FROM invoices.invoice_date) AS invoice_year,
    EXTRACT(MONTH FROM invoices.invoice_date) AS invoice_month,
    invoices.revenue AS revenue
  FROM invoices
)
GROUP BY invoice_year

Основные агрегатные функции

`AVG()`

Доступно в

DSQL

Синтаксис

AVG([ALL | DISTINCT] <expr>)

Table 1. Параметры функции AVG

Параметр	Описание
expr	Выражение. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.

Тип возвращаемого результата

зависит от типа аргумента функции.

Функция AVG возвращает среднее значение для группы. Значения NULL пропускаются.

Параметр ALL (по умолчанию) применяет агрегатную функцию ко всем значениям.
Параметр DISTINCT указывает на то, что функция AVG будет выполнена только для одного экземпляра каждого уникального значения, независимо от того, сколько раз встречается это значение.
В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Table 2. Тип результата функции AVG в зависимости от типа аргумента

Тип входного аргумента	Тип результат функции
`FLOAT`, `DOUBLE PRECISION`	`DOUBLE PRECISION`
`SMALLINT`, `INTEGER`, `BIGINT`	`BIGINT`. В первом диалекте `INTEGER`.
`INT128`	`INT128`
`DECIMAL/NUMERIC(p, n)`, где `p < 19`	`DECIMAL/NUMERIC(18, n)`
`DECIMAL/NUMERIC(p, n)`, где `p >= 19`	`DECIMAL/NUMERIC(38, n)`
`DECFLOAT(16)`	`DECFLOAT(16)`
`DECFLOAT(34)`	`DECFLOAT(34)`

Примеры `AVG`

Example 2. Использование функции AVG

SELECT
  dept_no,
  AVG(salary)
FROM employee
GROUP BY dept_no

См. также:

SELECT.

`COUNT()`

Доступно в

DSQL

Синтаксис

COUNT([ALL | DISTINCT] <expr> | *)

Table 3. Параметры функции COUNT

Параметр	Описание
expr	Выражение. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.

Тип возвращаемого результата

BIGINT

Функция COUNT возвращает количество значений в группе, которые не являются NULL.

По умолчанию используется ALL: функция просто считает все значения в наборе, которые не равны NULL.
Если указан DISTINCT дубликаты исключаются из подсчитываемого набора.
Если вместо выражения expr указано COUNT (*), будут подсчитаны все записи.
- не может использоваться с ключевым словом DISTINCT
- дубликаты записей не исключаются
- при этом учитываются записи содержащие NULL
Для пустой выборки данных или если при выборке окажутся одни значения, содержащие NULL, функция возвратит значение равное 0.

Примеры `COUNT`

Example 3. Использование функции COUNT

SELECT
  dept_no,
  COUNT(*) AS cnt,
  COUNT(DISTINCT name) AS cnt_name
FROM employee
GROUP BY dept_no

См. также:

SELECT.

`LIST()`

Доступно в

DSQL

Синтаксис

LIST([ALL | DISTINCT] <expr> [, separator])

Table 4. Параметры функции LIST

Параметр	Описание
expr	Выражение. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает строковый тип данных или `BLOB`. Поля типа дата / время и числовые преобразуются к строке.
separator	Разделитель. Выражение строкового типа. По умолчанию разделителем является запятая.

Тип возвращаемого результата

BLOB

Функция LIST возвращает строку, состоящую из значений аргумента, отличных от NULL в группе, разделенных запятой или заданным пользователем разделителем. Если нет значений, отличных от NULL (включая случай, когда группа пуста), возвращается NULL.

ALL (по умолчанию) приводит к обработке всех значений, отличных от NULL. Если указано ключевое слово DISTINCT, то дубликаты удаляются, за исключением случаев, когда expr является BLOB.
Необязательный аргумент separator может быть любым строковым выражением. Это позволяет указать, например, ascii_char (13) в качестве разделителя.
Аргументы expr и separator поддерживают BLOB любого размера и набора символов.
Дата / время и числовые аргументы неявно преобразуются в строки перед объединением.
Результатом функции является текстовый BLOB, кроме случаев, когда expr является BLOB другого подтипа.
Порядок значений в списке не определен — порядок, в котором строки объединяются, определяется порядком чтения из исходного набора данных. Для таблиц такой порядок обычно не определяется. Если порядок важен, исходные данные можно предварительно отсортировать используя производную таблицы или аналогичное средство.

Примеры `LIST`

Example 4. Использование функции LIST

Получение списка, порядок не определён.

SELECT LIST (display_name, '; ')
FROM GR_WORK;

Example 5. Использование функции LIST с заданным порядком

Получение списка в алфавитном порядке.

SELECT LIST (display_name, '; ')
FROM (SELECT display_name
      FROM GR_WORK
      ORDER BY display_name);

См. также:

SELECT.

`MAX()`

Доступно в

DSQL

Синтаксис

MAX([ALL | DISTINCT] <expr>)

Table 5. Параметры функции MAX

Параметр	Описание
expr	Выражение. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.

Тип возвращаемого результата

тот же что и аргумент функции expr.

Функция MAX возвращает максимальный элемент выборки, которые не равны NULL.

Если группа пуста или содержит только NULL, результатом будет NULL.
Если входным аргументом является строка, то функция вернет значение, которое будет последним в сортировке с использованием соответствующего COLLATE.
Эта функция полностью поддерживает текстовые BLOB любого размера и набора символов.

Note	Параметр `DISTINCT` не имеет смысла при использовании функцией `MAX` и доступен только для совместимости со стандартом.

Примеры `MAX`

Example 6. Использование функции MAX

SELECT
  dept_no,
  MAX(salary)
FROM employee
GROUP BY dept_no

См. также:

SELECT, MIN().

`MIN()`

Доступно в

DSQL

Синтаксис

MIN([ALL | DISTINCT] <expr>)

Table 6. Параметры функции MIN

Параметр	Описание
expr	Выражение. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF.

Тип возвращаемого результата

тот же что и аргумент функции expr

Функция MIN возвращает минимальный элемент выборки, которые не равны NULL.

Если группа пуста или содержит только NULL, результатом будет NULL.
Если входным аргументом является строка, то функция вернет значение, которое будет первым в сортировке с использованием соответствующего COLLATE.
Эта функция полностью поддерживает текстовые BLOB любого размера и набора символов.

Note	Параметр `DISTINCT` не имеет смысла при использовании функцией `MIN` и доступен только для совместимости со стандартом.

Примеры `MIN`

Example 7. Использование функции MIN

SELECT
  dept_no,
  MIN(salary)
FROM employee
GROUP BY dept_no

См. также:

SELECT, MAX().

`SUM()`

Доступно в

DSQL

Синтаксис

SUM([ALL | DISTINCT] <expr>)

Table 7. Параметры функции SUM

Параметр	Описание
expr	Выражение. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных.

Тип возвращаемого результата

зависит от типа аргумента функции. Обычно, если это возможно, выбирается тип с большей вместимостью, чем тип выражения expr.

Функция SUM возвращает сумму элементов выборки, которые не равны NULL.

ALL является опцией по умолчанию — обрабатываются все значения из выборки, не содержащие NULL. При указании DISTINCT из выборки устраняются дубликаты, после чего осуществляется суммирование.
При пустой выборке, или при выборке из одних NULL функция возвратит NULL.

Table 8. Тип результата функции SUM в зависимости от типа аргумента

Тип входного аргумента	Тип результат функции
`FLOAT`, `DOUBLE PRECISION`	`DOUBLE PRECISION`
`SMALLINT`, `INTEGER`	`BIGINT`
`BIGINT`, `INT128`	`INT128`
`DECIMAL/NUMERIC(p, n)`, где `p < 10`	`DECIMAL/NUMERIC(18, n)`
`DECIMAL/NUMERIC(p, n)`, где `p >= 10`	`DECIMAL/NUMERIC(38, n)`
`DECFLOAT(16)`, `DECFLOAT(34)`	`DECFLOAT(34)`

Примеры `SUM`

Example 8. Использование функции SUM

SELECT
  dept_no,
  SUM(salary)
FROM employee
GROUP BY dept_no

См. также:

SELECT.

Статистические функции

Статистические функции являются агрегатными функциями. Эти функции не учитывают значения NULL. К аргументу статистической функции не применимы параметры ALL и DISTINCT.

Статистические функции часто используются совместно с предложением GROUP BY.

`CORR()`

Доступно в

DSQL

Синтаксис

CORR(<expr1>, <expr2>)

Table 9. Параметры функции CORR

Параметр	Описание
expr1, expr2	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция CORR возвращает коэффициент корреляции для пары выражений, возвращающих числовые значения.

Функция CORR(<expr1>, <expr2>) эквивалентна

COVAR_POP(<expr1>, <expr2>) / (STDDEV_POP(<expr2>) * STDDEV_POP(<expr1>))

В статистическом смысле, корреляция — это степень связи между переменными. Связь между переменными означает, что значение одной переменной можно в определённой степени предсказать по значению другой. Коэффициент корреляции представляет степень корреляции в виде числа в диапазоне от -1 (высокая обратная корреляция) до 1 (высокая корреляция). Значение 0 соответствует отсутствию корреляции.

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `CORR`

Example 9. Использование функции CORR

SELECT
    CORR(alength, aheight) AS c_corr
FROM measure

См. также:

COVAR_POP(), STDDEV_POP().

`COVAR_POP()`

Доступно в

DSQL

Синтаксис

COVAR_POP(<expr1>, <expr2>)

Table 10. Параметры функции COVAR_POP

Параметр	Описание
expr1, expr2	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция COVAR_POP возвращает ковариацию совокупности (population covariance) пар выражений с числовыми значениями.

Функция COVAR_POP(<expr1>, <expr2>) эквивалентна

(SUM(<expr1> * <expr2>) - SUM(<expr1>) * SUM(<expr2>) / COUNT(*))
  / COUNT(*)

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `COVAR_POP`

Example 10. Использование функции COVAR_POP

SELECT
    COVAR_POP(alength, aheight) AS c_corr
FROM measure

См. также:

COVAR_SAMP(), SUM(), COUNT().

`COVAR_SAMP()`

Доступно в

DSQL

Синтаксис

COVAR_SAMP(<expr1>, <expr2>)

Table 11. Параметры функции COVAR_SAMP

Параметр	Описание
expr1, expr2	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция COVAR_SAMP возвращает выборочную ковариацию (sample covariance) пары выражений с числовыми значениями.

Функция COVAR_SAMP(<expr1>, <expr2>) эквивалентна

(SUM(<expr1> * <expr2>) - SUM(<expr1>) * SUM(<expr2>) / COUNT(*))
  / (COUNT(*) - 1)

В случае если выборка записей пустая, содержит только 1 запись или содержит только значения NULL, результат будет содержать NULL.

Примеры `COVAR_SAMP`

Example 11. Использование функции COVAR_SAMP

SELECT
    COVAR_SAMP(alength, aheight) AS c_corr
FROM measure

См. также:

COVAR_POP(), SUM(), COUNT().

`STDDEV_POP()`

Доступно в

DSQL

Синтаксис

STDDEV_POP(<expr>)

Table 12. Параметры функции STDDEV_POP

Параметр	Описание
expr	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr.

Функция STDDEV_POP возвращает среднеквадратичное отклонение для группы. Значения NULL пропускаются.

Функция STDDEV_POP(<expr>) эквивалентна

SQRT(VAR_POP(<expr>))

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `STDDEV_POP`

Example 12. Использование функции STDDEV_POP

SELECT
  dept_no,
  STDDEV_POP(salary)
FROM employee
GROUP BY dept_no

См. также:

STDDEV_POP(), VAR_POP().

`STDDEV_SAMP()`

Доступно в

DSQL

Синтаксис

STDDEV_SAMP(<expr>)

Table 13. Параметры функции STDDEV_SAMP

Параметр	Описание
expr	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr

Функция STDDEV_SAMP возвращает стандартное отклонение для группы. Значения NULL пропускаются.

Функция STDDEV_SAMP(<expr>) эквивалентна

SQRT(VAR_SAMP(<expr>))

Примеры `STDDEV_SAMP`

Example 13. Использование функции STDDEV_SAMP

SELECT
  dept_no,
  STDDEV_SAMP(salary)
FROM employee
GROUP BY dept_no

См. также:

STDDEV_POP(), VAR_SAMP().

`VAR_POP()`

Доступно в

DSQL

Синтаксис

VAR_POP(<expr>)

Table 14. Параметры функции VAR_POP

Параметр	Описание
expr	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr

Функция VAR_POP возвращает выборочную дисперсию для группы. Значения NULL пропускаются.

Функция VAR_POP(<expr>) эквивалентна

(SUM(<expr> * <expr>) - SUM(<expr>) * SUM(<expr>) / COUNT(<expr>))
  / COUNT(<expr>)

В случае если выборка записей пустая или содержит только значения NULL, результат будет содержать NULL.

Примеры `VAR_POP`

Example 14. Использование функции VAR_POP

SELECT
  dept_no,
  VAR_POP(salary)
FROM employee
GROUP BY dept_no

См. также:

VAR_SAMP(), SUM(), COUNT().

`VAR_SAMP()`

Доступно в

DSQL

Синтаксис

VAR_SAMP(<expr>)

Table 15. Параметры функции VAR_SAMP

Параметр	Описание
expr	Выражение возвращает числовой тип данных. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION или NUMERIC в зависимости от типа expr

Функция VAR_SAMP возвращает несмещённую выборочную дисперсию для группы. Значения NULL пропускаются.

Функция VAR_SAMP(<expr>) эквивалентна

(SUM(<expr> * <expr>) - SUM(<expr>) * SUM(<expr>) / COUNT(<expr>))
  / (COUNT(<expr>) - 1)

Примеры `VAR_SAMP`

Example 15. Использование функции VAR_SAMP

SELECT
  dept_no,
  VAR_SAMP(salary)
FROM employee
GROUP BY dept_no

См. также:

VAR_POP(), SUM(), COUNT().

Функции линейной регрессии

Функции линейной регрессии полезны для продолжения линии тренда. Линия тренда — это, как правило, закономерность, которой придерживается набор значений. Линия тренда полезна для прогнозирования будущих значений. Этот означает, что тренд будет продолжаться и в будущем. Для продолжения линии тренда необходимо знать угол наклона и точку пересечения с осью Y. Набор линейных функций включает функции для вычисления этих значений.

В синтаксисе функций, у интерпретируется в качестве переменной, зависящей от х.

`REGR_AVGX()`

Доступно в

DSQL

Синтаксис

REGR_AVGX ( <y>, <x> )

Table 16. Параметры функции REGR_AVGX

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_AVGX вычисляет среднее независимой переменной линии регрессии.

Функция REGR_AVGX(<y>, <x>) эквивалентна

SUM(<exprX>) / REGR_COUNT(<y>, <x>)

<exprX> ::=
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END

См. также:

REGR_COUNT(), REGR_AVGY().

`REGR_AVGY()`

Доступно в

DSQL

Синтаксис

REGR_AVGY(<y>, <x>)

Table 17. Параметры функции REGR_AVGY

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_AVGY вычисляет среднее зависимой переменной линии регрессии.

Функция REGR_AVGY(<y>, <x>) эквивалентна

SUM(<exprY>) / REGR_COUNT(<y>, <x>)

<exprY> ::=
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <y> END

См. также:

REGR_COUNT(), REGR_AVGX().

`REGR_COUNT()`

Доступно в

DSQL

Синтаксис

REGR_COUNT(<y>, <x>)

Table 18. Параметры функции REGR_COUNT

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

BIGINT

Функция REGR_COUNT возвращает количество не пустых пар, используемых для создания линии регрессии.

Функция REGR_COUNT(<y>, <x>) эквивалентна

SUM(CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN 1 END)

См. также: SUM()

`REGR_INTERCEPT()`

Доступно в

DSQL

Синтаксис

REGR_INTERCEPT(<y>, <x>)

Table 19. Параметры функции REGR_INTERCEPT

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_INTERCEPT вычисляет точку пересечения линии регрессии с осью Y.

Функция REGR_INTERCEPT(<y>, <x>) эквивалентна

REGR_AVGY(<y>, <x>) - REGR_SLOPE(<y>, <x>) * REGR_AVGX(<y>, <x>)

Примеры `REGR_INTERCEPT`

Example 16. Прогнозирование объёмов продаж

WITH RECURSIVE years(byyear) AS (
  SELECT 1991 FROM rdb$database UNION ALL
  SELECT byyear+1 FROM years WHERE byyear < 2020
),
s AS (
  SELECT EXTRACT(YEAR FROM order_date) AS byyear,
         SUM(total_value) AS total_value
  FROM sales GROUP BY 1
),
regr AS (
  SELECT REGR_INTERCEPT(total_value, byyear) as intercept,
         REGR_SLOPE(total_value, byyear) as slope
FROM s)
SELECT years.byyear AS byyear,
       intercept + (slope * years.byyear) AS total_value
FROM years CROSS JOIN regr

BYYEAR     TOTAL_VALUE
----------------------------
 1991        118377,35
 1992        414557,62
 1993        710737,89
 1994       1006918,16
 1995       1303098,43
 1996       1599278,69
 1997       1895458,96
 1998       2191639,23
 1999       2487819,50
 2000       2783999,77
...

См. также:

REGR_AVGY(), REGR_AVGX(), REGR_SLOPE().

`REGR_R2()`

Доступно в

DSQL

Синтаксис

REGR_R2(<y>, <x>)

Table 20. Параметры функции REGR_R2

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_R2 вычисляет коэффициент детерминации, или R-квадрат, линии регрессии.

Функция REGR_R2(<y>, <x>) эквивалентна

POWER(CORR(<y>, <x>), 2)

См. также:

CORR(), [fblangref-scalarfuncs-power]

`REGR_SLOPE()`

Доступно в

DSQL

Синтаксис

REGR_SLOPE(<y>, <x>)

Table 21. Параметры функции REGR_SLOPE

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Функция REGR_SLOPE вычисляет угол наклона линии регрессии.

Функция REGR_SLOPE(<y>, <x>) эквивалентна

COVAR_POP(<y>, <x>) / VAR_POP(<exprX>)

<exprX> :==
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END

См. также:

COVAR_POP(), VAR_POP().

`REGR_SXX()`

Доступно в

DSQL

Синтаксис

REGR_SXX(<y>, <x>)

Table 22. Параметры функции REGR_SXX

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Диагностическая статистика, используемая для анализа регрессии.

Функция REGR_SXX(<y>, <x>) вычисляется следующим образом:

REGR_COUNT(<y>, <x>) * VAR_POP(<exprX>)

<exprX> :==
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <x> END

См. также:

REGR_COUNT(), VAR_POP().

`REGR_SXY()`

Доступно в

DSQL

Синтаксис

REGR_SXY(<y>, <x>)

Table 23. Параметры функции REGR_SXY

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Диагностическая статистика, используемая для анализа регрессии.

Функция REGR_SXY(<y>, <x>) вычисляется следующим образом:

REGR_COUNT(<y>, <x>) * COVAR_POP(<y>, <x>)

См. также:

REGR_COUNT(), COVAR_POP().

`REGR_SYY()`

Доступно в

DSQL

Синтаксис

REGR_SYY(<y>, <x>)

Table 24. Параметры функции REGR_SYY

Параметр	Описание
y	Зависимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.
x	Независимая переменная линии регрессии. Может содержать столбец таблицы, константу, переменную, выражение, неагрегатную функцию или UDF, которая возвращает числовой тип данных. Агрегатные функции в качестве выражения не допускаются.

Параметр

Описание

Тип возвращаемого результата

DOUBLE PRECISION

Диагностическая статистика, используемая для анализа регрессии.

Функция REGR_SYY(<y>, <x>) вычисляется следующим образом:

REGR_COUNT(<y>, <x>) * VAR_POP(<exprY>)

<exprY> :==
  CASE WHEN <x> IS NOT NULL AND <y> IS NOT NULL THEN <y> END

См. также:

REGR_COUNT(), VAR_POP().

FilesExpand file tree

_fblangref-functions-aggregate.adoc

Latest commit

History

_fblangref-functions-aggregate.adoc

File metadata and controls

Агрегатные функции

Предложение FILTER

Примеры FILTER

Основные агрегатные функции

AVG()

Примеры AVG

COUNT()

Примеры COUNT

LIST()

Примеры LIST

MAX()

Примеры MAX

MIN()

Примеры MIN

SUM()

Примеры SUM

Статистические функции

CORR()

Примеры CORR

COVAR_POP()

Примеры COVAR_POP

COVAR_SAMP()

Примеры COVAR_SAMP

STDDEV_POP()

Примеры STDDEV_POP

STDDEV_SAMP()

Примеры STDDEV_SAMP

VAR_POP()

Примеры VAR_POP

VAR_SAMP()

Примеры VAR_SAMP

Функции линейной регрессии

REGR_AVGX()

REGR_AVGY()

REGR_COUNT()

REGR_INTERCEPT()

Примеры REGR_INTERCEPT

REGR_R2()

REGR_SLOPE()

REGR_SXX()

REGR_SXY()

REGR_SYY()

Предложение `FILTER`

Примеры `FILTER`

`AVG()`

Примеры `AVG`

`COUNT()`

Примеры `COUNT`

`LIST()`

Примеры `LIST`

`MAX()`

Примеры `MAX`

`MIN()`

Примеры `MIN`

`SUM()`

Примеры `SUM`

`CORR()`

Примеры `CORR`

`COVAR_POP()`

Примеры `COVAR_POP`

`COVAR_SAMP()`

Примеры `COVAR_SAMP`

`STDDEV_POP()`

Примеры `STDDEV_POP`

`STDDEV_SAMP()`

Примеры `STDDEV_SAMP`

`VAR_POP()`

Примеры `VAR_POP`

`VAR_SAMP()`

Примеры `VAR_SAMP`

`REGR_AVGX()`

`REGR_AVGY()`

`REGR_COUNT()`

`REGR_INTERCEPT()`

Примеры `REGR_INTERCEPT`

`REGR_R2()`

`REGR_SLOPE()`

`REGR_SXX()`

`REGR_SXY()`

`REGR_SYY()`