PostgreSQL 数据类型

在本章中，我们将讨论PostgreSQL中使用的数据类型。在创建表时，您为每个列指定一个数据类型，即您要在表字段中存储的数据类型。

这样做有以下几个好处：

一致性 - 对相同数据类型的列的操作会产生一致的结果，并且通常是最快的。
验证 - 正确使用数据类型可以对数据进行格式验证，并拒绝超出数据类型范围的数据。
紧凑 - 由于列只能存储一种类型的值，所以以紧凑的方式存储。
性能 - 正确使用数据类型可以使数据存储最高效。存储的值可以快速处理，提高性能。

PostgreSQL支持广泛的数据类型。此外，用户可以使用CREATE TYPE SQL命令创建自定义数据类型。PostgreSQL中有不同类别的数据类型，下面将对它们进行讨论。

数值类型

数值类型包括两字节、四字节和八字节的整数、四字节和八字节的浮点数，以及可选择精度的十进制数。下表列出了可用的类型。

名称	存储大小	描述	范围
smallint	2字节	小范围整数	-32768到+32767
integer	4字节	整数的典型选择	-2147483648到+2147483647
bigint	8字节	大范围整数	-9223372036854775808到9223372036854775807
decimal	可变	用户指定的精度，精确的	小数点前最多131072位数；小数点后最多16383位数
numeric	可变	用户指定的精度，精确的	小数点前最多131072位数；小数点后最多16383位数
real	4字节	可变精度，不精确的	6位小数精度
double precision	8字节	可变精度，不精确的	15位小数精度
smallserial	2字节	小自增整数	1到32767
serial	4字节	自增整数	1到2147483647
bigserial	8字节	大自增整数	1到9223372036854775807

货币类型

货币类型是一个带有固定小数精度的货币金额。可以将数值、整数和大整数数据类型转换为货币类型。不推荐使用浮点数处理货币，因为可能会出现舍入误差。

名称	存储大小	描述	范围
money	8字节	货币金额	-92233720368547758.08到+92233720368547758.07

字符类型

下表列出了PostgreSQL中可用的通用字符类型。

编号	名称和描述
1	character varying(n), varchar(n) 可变长度，带限制
2	character(n), char(n) 固定长度，空格填充
3	text 可变无限长度

二进制数据类型

bytea数据类型允许存储二进制字符串，如下表所示。

名称	存储大小	描述
bytea	1或4个字节加上实际的二进制字符串	可变长度二进制字符串

日期/时间类型

PostgreSQL支持完整的SQL日期和时间类型，如下表所示。日期按照公历计算。这里，所有类型的分辨率都是 1微秒/14位数字 ，除了日期类型，其分辨率为天。

名称	存储大小	描述	低值	高值
timestamp [(p)] [without time zone ]	8 字节	日期和时间 (无时区)	公元前4713年	公元294276年
TIMESTAMPTZ	8 字节	日期和时间，带有时区	公元前4713年	公元294276年
date	4 字节	日期 (不包含时间)	公元前4713年	公元5874897年
time [ (p)] [ without time zone ]	8 字节	时间 (不包含日期)	00:00:00	24:00:00
time [ (p)] with time zone	12 字节	时间，带有时区	00:00:00+1459	24:00:00-1459
interval [fields ] [(p) ]	12 字节	时间间隔	-178000000 年	178000000 年

布尔类型

PostgreSQL提供了标准的SQL类型布尔。布尔数据类型可以有以下三种状态：真（true），假（false）和第三种状态未知（unknown），该状态由SQL的null值表示。

Name	存储大小	Description
boolean	1 byte	state of true or false

枚举类型

枚举（enum）类型是由静态有序值组成的数据类型。它们相当于许多编程语言中支持的枚举类型。

与其他类型不同，枚举类型需要使用CREATE TYPE命令创建。该类型用于存储静态有序的一组值。例如，指南针方向，即北，南，东和西，或以下示例中的星期几−

CREATE TYPE week AS ENUM ('Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun');

枚举一旦创建，可以像其他类型一样使用。

几何类型

几何数据类型表示二维空间对象。最基本的类型是点，为所有其他类型提供基础。

名称	存储大小	表示	描述
point	16 bytes	Point on a plane	(x,y)
line	32 bytes	Infinite line (not fully implemented)	((x1,y1),(x2,y2))
lseg	32 bytes	Finite line segment	((x1,y1),(x2,y2))
box	32 bytes	Rectangular box	((x1,y1),(x2,y2))
path	16+16n bytes	Closed path (similar to polygon)	((x1,y1),…)
path	16+16n bytes	Open path	[(x1,y1),…]
polygon	40+16n	Polygon (similar to closed path)	((x1,y1),…)
circle	24 bytes	Circle	<(x,y),r> (center point and radius)

网络地址类型

PostgreSQL提供了用于存储IPv4、IPv6和MAC地址的数据类型。在存储网络地址时，最好使用这些类型而不是普通的文本类型，因为这些类型提供了输入错误检查和特殊的操作符和函数。

名称	存储大小	描述
cidr	7 or 19 bytes	IPv4 and IPv6 networks
inet	7 or 19 bytes	IPv4 and IPv6 hosts and networks
macaddr	6 bytes	MAC addresses

位字符串类型

位字符串类型用于存储位掩码。它们的值要么是0，要么是1。有两种SQL位类型： 位(n) 和 位可变(n) ，其中n是一个正整数。

文本搜索类型

该类型支持全文搜索，即在自然语言文档集合中搜索以找到最佳匹配查询的文档。有两种数据类型可用于此-

序号	名字和说明
1	tsvector 这是一个经过归一化处理的排序列表，合并了相同单词的不同变体，称为“词素”。
2	tsquery 这存储了要搜索的词素，并结合布尔操作符 & (AND)，\| (OR)和! (NOT)进行组合。括号可以用于强制操作符的分组。

UUID类型

UUID（通用唯一标识符）以一串小写十六进制数字的形式编写，由几个以连字符分隔的组组成，具体包括八个数字的一组，后跟三个四个数字的组，最后是一个包含12个数字的组，总共32个数字表示128位。

UUID的一个示例是：550e8400-e29b-41d4-a716-446655440000

XML类型

XML数据类型可用于存储XML数据。要存储XML数据，首先需要使用xmlparse函数创建XML值，如下所示：

XMLPARSE (DOCUMENT '<?xml version="1.0"?>
<tutorial>
<title>PostgreSQL Tutorial </title>
   <topics>...</topics>
</tutorial>')

XMLPARSE (CONTENT 'xyz<foo>bar</foo><bar>foo</bar>')

JSON类型

json数据类型可用于存储JSON（JavaScript对象标记）数据。此类数据也可以存储为文本，但是json数据类型具有检查每个存储的值是否为有效JSON值的优势。还有一些相关的支持函数可用于直接处理JSON数据类型，如下所示。

示例	示例结果
array_to_json(‘{{1,5},{99,100}}’::int[])	[[1,5],[99,100]]
row_to_json(row(1,’foo’))	{“f1″:1,”f2″:”foo”}

数组类型

PostgreSQL提供了将表的列定义为可变长度多维数组的机会。可以创建任何内置或用户定义的基本类型、枚举类型或复合类型的数组。

数组的声明

数组类型可以声明为

CREATE TABLE monthly_savings (
   name text,
   saving_per_quarter integer[],
   scheme text[][]
);

或者使用关键词”ARRAY”作为

CREATE TABLE monthly_savings (
   name text,
   saving_per_quarter integer ARRAY[4],
   scheme text[][]
);

插入值

数组的值可以作为一个字面常量插入，将元素值放在花括号内，用逗号分隔。下面是一个示例：

INSERT INTO monthly_savings 
VALUES (‘Manisha’, 
‘{20000, 14600, 23500, 13250}’, 
‘{{“FD”, “MF”}, {“FD”, “Property”}}’);

访问数组

下面是一个访问数组的示例。下面的命令将选择在第二季度储蓄更多的人比在第四季度。

SELECT name FROM monhly_savings WHERE saving_per_quarter[2] > saving_per_quarter[4];

修改数组

修改数组的示例如下所示。

UPDATE monthly_savings SET saving_per_quarter = '{25000,25000,27000,27000}'
WHERE name = 'Manisha';

或者使用ARRAY表达式语法 –

UPDATE monthly_savings SET saving_per_quarter = ARRAY[25000,25000,27000,27000]
WHERE name = 'Manisha';

搜索数组

搜索数组的示例如下所示。

SELECT * FROM monthly_savings WHERE saving_per_quarter[1] = 10000 OR
saving_per_quarter[2] = 10000 OR
saving_per_quarter[3] = 10000 OR
saving_per_quarter[4] = 10000;

如果数组的大小已知，可以使用上面提供的搜索方法。否则，下面的示例显示了在大小未知时如何搜索。

SELECT * FROM monthly_savings WHERE 10000 = ANY (saving_per_quarter);

复合类型

该类型表示字段名及其数据类型的列表，即表格中一行或记录的结构。

复合类型的声明

以下示例展示了如何声明一个复合类型。

CREATE TYPE inventory_item AS (
   name text,
   supplier_id integer,
   price numeric
);

这种数据类型可以在创建表时使用，如下所示−

CREATE TABLE on_hand (
   item inventory_item,
   count integer
);

组合值输入

组合值可以作为字面常量插入，将字段值括在括号内，用逗号分隔。下面是一个示例：

INSERT INTO on_hand VALUES (ROW('fuzzy dice', 42, 1.99), 1000);

这对于上述定义的 inventory_item 是有效的。当表达式中有多个字段时，ROW 关键字实际上是可选的。

访问复合类型

要访问复合列的字段，请使用一个点后面跟着字段名称，就像从表名称中选择字段一样。例如，要从我们的 on_hand 示例表中选择一些子字段，查询如下图所示 –

SELECT (item).name FROM on_hand WHERE (item).price > 9.99;

你甚至可以使用表名（比如在多表查询中）来做如下操作：

SELECT (on_hand.item).name FROM on_hand WHERE (on_hand.item).price > 9.99;

范围类型

范围类型表示使用数据范围的数据类型。范围类型可以是离散范围（例如，整数值1到10之间的所有值）或连续范围（例如，上午10:00和上午11:00之间的任何时间点）。

可用的内置范围类型包括以下范围：

int4range - 整数范围
int8range - bigint范围
numrange - 数字范围
tsrange - 没有时区的时间戳范围
tstzrange - 带有时区的时间戳范围
daterange - 日期范围

可以创建自定义范围类型，以使新类型的范围可用，例如使用inet类型作为基础的IP地址范围，或使用浮点数据类型作为基础的浮点范围。

范围类型使用 [ ] 和 ( ) 字符支持包含和排除范围边界。例如，'[4,9)’ 表示从4开始并包括4直到但不包括9的所有整数。

对象标识符类型

对象标识符（OID）在PostgreSQL内部用作各种系统表的主键。只有在指定了WITH OIDS或启用了default_with_oids配置变量时，才会将OID添加到用户创建的表中。以下表列出了几个别名类型。OID别名类型除了专门的输入和输出例程之外，没有自己的操作。

名称	引用	描述	值示例
oid	任意	数字对象标识符	564182
regproc	pg_proc	函数名称	sum
regprocedure	pg_proc	带有参数类型的函数	sum(int4)
regoper	pg_operator	运算符名称	+
regoperator	pg_operator	带有参数类型的运算符	*(integer,integer)或-(NONE,integer)
regclass	pg_class	关系名称	pg_type
regtype	pg_type	数据类型名称	integer
regconfig	pg_ts_config	文本搜索配置	English
regdictionary	pg_ts_dict	文本搜索字典	simple

伪类型

PostgreSQL类型系统包含一些特殊用途的条目，统称为伪类型。伪类型不能用作列数据类型，但可以用于声明函数的参数或结果类型。

下表列出了现有的伪类型。

序号	名称和描述
1	any 表示函数接受任何输入数据类型。
2	anyelement 表示函数接受任何数据类型。
3	anyarray 表示函数接受任何数组数据类型。
4	anynonarray 表示函数接受任何非数组数据类型。
5	anyenum 表示函数接受任何枚举数据类型。
6	anyrange 表示函数接受任何范围数据类型。
7	cstring 表示函数接受或返回以空字符结尾的C字符串。
8	internal 表示函数接受或返回服务器内部数据类型。
9	language_handler 声明一个过程化语言调用处理程序，返回language_handler。
10	fdw_handler 声明一个外部数据包装器处理程序，返回fdw_handler。
11	record 标识返回未指定行类型的函数。
12	trigger 声明一个触发器函数，返回trigger。
13	void 表示函数不返回任何值。