Postgres 数据类型

type	alias	desc
bigint	int8	有符号的八字节整数
bigserial	serial8	自增的八字节整数
`bit[(n)]`		固定长度的位串
`bit varying[(n)]`	`varbit[(n)]`	可变长度的位串
boolean	bool	逻辑布尔值（真/假）
box		平面上的矩形框
bytea		二进制数据（“字节数组”）
`character[(n)]`	`char[(n)]`	固定长度的字符串
`character varying[(n)]`	`varchar[(n)]`	可变长度的字符串
cidr		IPv4或IPv6网络地址
circle		平面上的圆
date		日历日期（年，月，日）
double precision	float8	双精度浮点数（8字节）
inet		IPv4或IPv6主机地址
integer	int, int4	有符号的四字节整数
`interval [ fields ][(p)]`		时间跨度
json		文本JSON数据
jsonb		二进制JSON数据，解构后的
line		平面上的无限线
lseg		平面上的线段
macaddr		MAC（媒体访问控制）地址
macaddr8		MAC（媒体访问控制）地址（EUI-64格式）
money		货币金额
`numeric[(p,s)]`	`decimal[(p,s)]`	可选择精度的精确数字
path		平面上的几何路径
pg_lsn		PostgreSQL日志序列号
pg_snapshot		用户级事务ID快照
point		平面上的几何点
polygon		平面上的封闭几何路径
real	float4	单精度浮点数（4字节）
smallint	int2	有符号的两字节整数
smallserial	serial2	自增的两字节整数
serial	serial4	自增的四字节整数
text		可变长度的字符串
`time[(p)] [without time zone]`		时间（无时区）
`time[(p)] with time zone`	timetz	包含时区的时间
`timestamp[(p)] [without time zone]`		日期和时间（无时区）
`timestamp[(p)] with time zone`	timestamptz	包含时区的日期和时间
tsquery		文本搜索查询
tsvector		文本搜索文档
~~txid_snapshot~~		用户级事务ID快照（已弃用；见 pg_snapshot）
uuid		通用唯一标识符
xml		XML数据

-- array length
SELECT array_length(ARRAY[1,2,3], 1);
-- remove element from array
SELECT array_remove(ARRAY[1,2,3], 2);
SELECT array_remove(ARRAY ['A','B','C'], 'B');

-- end of month
select to_char(date_trunc('month', '2021-02-27'::date) + interval '1 month - 1 day', 'YYYY-MM-DD');

Data Types

UUID

原生支持 uuid 类型 - 底层为 byte[4] - 比存字符串效率更高

CREATE EXTENSION IF NOT EXISTS pgcrypto;
-- pg 13 后不需要扩展也能使用该函数
SELECT gen_random_uuid();

OID

Object Identifier Types
regproc

时间日期

Date/Time Types

Name	Min	Max	Resolution	Size
timestamp	4713 BC	294276 AD	微秒	8 bytes
timestamptz	4713 BC	294276 AD	微秒	8 bytes
date	4713 BC	5874897 AD	天	4 bytes
time	00:00:00	24:00:00	微秒	8 bytes
timetz	00:00:00+1459	24:00:00-1459	微秒	12 bytes
interval	-178000000 years	178000000 years	微秒	16 bytes

interval
- interval '1 month - 1 day' 等价 interval '1 month' - interval '1 day'

-- 时区缩写
select * from pg_timezone_abbrevs;
-- 时区名字
select * from pg_timezone_names;

-- unix timestamp -> timestamp
select to_timestamp(1633072800);

/*
 * 表示拆分后的 interval（时间间隔）的数据结构。
 *
 * 出于历史原因，该结构体的设计参考了用于时间戳的 struct pg_tm。
 * 与时间戳不同，interval 的月和年字段没有特殊含义：仅为零或非零。
 * 注意各字段可能为负数；但由于从 struct Interval 转换时的除法运算，
 * 只有 tm_mday 可能为 INT_MIN。这一点很重要，因为某些代码路径下
 * 可能需要对这些值取相反数。
 */
struct pg_itm
{
  int			tm_usec;   // 微秒
  int			tm_sec;    // 秒
  int			tm_min;    // 分钟
  int64		tm_hour;   // 小时（需要较宽的数据类型）
  int			tm_mday;   // 天
  int			tm_mon;    // 月
  int			tm_year;   // 年
};

typedef int64 Timestamp;
typedef int64 TimestampTz;
typedef int64 TimeOffset;

/*
 * interval 类型的存储结构体。
 *
 * time 字段存储除天、月、年以外的所有时间单位（如秒、微秒等）。
 * day 字段存储天数，放在 time 字段之后以保证内存对齐。
 * month 字段存储月和年，同样放在 time 字段之后以保证对齐。
 */
typedef struct
{
  TimeOffset	time;	/* 除天、月、年以外的所有时间单位 */
  int32		day;	/* 天数，紧跟在 time 后面以保证对齐 */
  int32		month;	/* 月和年，紧跟在 time 后面以保证对齐 */
} Interval;

https://github.com/postgres/postgres/blob/master/src/include/datatype/timestamp.h

二进制数据

BinaryFilesInDB
使用 bytea 或 text，都使用 toast
单记录最大 1G
每个表最多 40 亿 > 2KB 的记录
在读写时可能需要编码解码
对内存要求较高，即便数据量较少

金额类型

大部分情况会使用 decimal(12,2)
- decimal 是 numeric 的别名
- 也可以考虑直接使用 integer 来存分
money
- 功能有限
- 比 numeric 性能更好
- 历史遗留 - 不要使用
参考
- PostgreSQL: Which Datatype should be used for Currency?
- 数字类型

经纬度

float8 存储单字段
point 存储两个字段
如果使用了 PostGIS 则用 geometry 或 geography 类型
参考
- Which data type for latitude and longitude?

ARRAY

https://www.postgresql.org/docs/current/functions-array.html

CREATE TABLE test (
    id serial PRIMARY KEY,
    tags text[]
);

-- filter array[]
SELECT * FROM test WHERE 'tag' = ANY(tags);
SELECT * FROM test WHERE tags @> ARRAY['tag1', 'tag2'];
-- array to string
SELECT array_to_string('{1,2}'::text[], ',', '');

select array[1,2,3];

Postgres 数据类型

UUID

OID

时间日期

二进制数据

金额类型

经纬度

ARRAY

FAQ

VARCHAR vs TEXT

INT vs BIGINT

UUID​

OID​

时间日期​

二进制数据​

金额类型​

经纬度​

ARRAY​

FAQ

VARCHAR vs TEXT​

INT vs BIGINT​

UUID

OID

时间日期

二进制数据

金额类型

经纬度

ARRAY

VARCHAR vs TEXT

INT vs BIGINT