跳到主要内容

SQLite

  • 数据类型
    • 存储类
      • NULL
      • INTEGER - 0, 1, 2, 3, 4, 6, 8 bytes - 内存中都为 int64
      • REAL - 8 byte
      • TEXT - UTF-8, UTF-16BE, UTF-16LE
      • BLOB
    • BOOLEAN -> 0,1
    • DATETIME -> TEXT ISO8601, REAL, INTEGER Unix Timestamp
    • 类型亲和 - 类型之间会进行内部转换
      • INT,INTEGER,TINYINT,SMALLINT,MEDIUMINT,BIGINT,UNSIGNED BIG INT, INT2, INT8 -> INTEGER
      • 其他类似
  • STRICT Tables
    • CREATE TABLE t1(a ANY) STRICT;
    • PRAGMA strict=ON;
    • 强制类型 - INT, INTEGER, REAL, TEXT, BLOB, ANY
    • ANY 和旧的类型类似
    • PRAGMA integrity_check, quick_check 可检测类型
    • 不会提升性能 - 运行时检测,对存储无影响,核心性能在于 IO
  • ROWID - int64
    • rowid, oid, _rowid_
    • 建表时可 WITHOUT ROWID
    • 如果表使用 INT 作为 pkey,则该列会被用于 rowid
      • CREATE TABLE t(x INTEGER PRIMARY KEY ASC, y, z);
    • btree 的 key
    • 通过 rowid 搜索和排序是普通 PRIMARY KEY 的两倍速度
  • 语法
  • 限制
    • 不可以 ALTER COLUMN - 只能 rename table/column 形式去变更
      • 不可以移除 UNIQUE - 推荐使用 UNIQUE INDEX - 可以被 drop
    • altertable
      • ALTER TABLE DROP COLUMN 不支持被引用的列
        • PRIMARY KEY, UNIQUE, 索引列, 包含在部分索引, 包含在 CHECK, 外键, 被用于生成列, 用于 trigger 和 view
    • Limits In SQLite
      • SQLITE_MAX_LENGTH=1,000,000,000 - 1G - text,blob 最大长度
      • SQLITE_MAX_COLUMN=2000 - 列
      • SQLITE_MAX_SQL_LENGTH=1G - sql 最大长度 - 使用 prepare 避免长 sql
      • JOIN 最多 64 个表
      • SQLITE_MAX_EXPR_DEPTH=1000
      • SQLITE_MAX_FUNCTION_ARG=127
      • SQLITE_MAX_COMPOUND_SELECT=500
      • SQLITE_MAX_LIKE_PATTERN_LENGTH=50000
      • SQLITE_MAX_VARIABLE_NUMBER=999 - v3.32.0 32766
      • SQLITE_MAX_TRIGGER_DEPTH=1000
      • SQLITE_MAX_ATTACHED=10
      • SQLITE_MAX_PAGE_COUNT=1073741823 - 1Gi - PRAGMA max_page_count
      • 281TB 库
      • 2^64 行
    • c_limit_attached
  • 参考
警告
  • SQLite 的类型是动态的 - 不强制 - 新版本支持严格类型
  • SQLite 的核心限制是并发写入性能 - 如果需要并发写入,不建议用 SQLite
  • DATETIME 不会存储毫秒
  • 没有 Base64 函数
  • BLOB 作为二进制存储部分语言的 Driver 支持不太好
  • 不支持 INSERT DEFAULT
  • column DEFAULT 表达式需要写为 (expr)
提示
  • 默认最多 999 个变量
  • WAL 模式可提升 单写多读 性能 - PRAGMA journal_mode=WAL
  • 可以配合 zfs 进行压缩 - 注意使用相同的 page size
  • vacuum 是先写入临时文件,然后替换 - 需要很大空间
# macOS 安装
brew install sqlite3
# 因为系统自带 - 所以默认不会添加到 PATH
$(brew --prefix sqlite3)/bin/sqlite3
# 添加安装的 sqlite3 到 PATH
export PATH="/usr/local/opt/sqlite/bin:$PATH"
-- 日期函数
-- https://sqlite.org/lang_datefunc.html
-- 转换时间戳
select datetime( 1323648000, 'unixepoch' );
-- 获取时间戳, 带毫秒
SELECT CAST((julianday('now') - 2440587.5) * 86400000 AS INTEGER);
-- 默认值带毫秒
CREATE TABLE IF NOT EXISTS event
(
create_at DATETIME DEFAULT (STRFTIME('%Y-%m-%d %H:%M:%f', 'NOW'))
);

-- 附加其他文件到数据库
ATTACH 'cache.db' AS cache;
-- 所有表
.tables
-- 显示 create 表
.schema urls

数据操作

导入 csv

-- 可以不用创建
create table foo(a, b);
.mode csv
.import test.csv foo

导出 csv

.output data.csv
select * from foo;

csv 虚拟表

-- 加载扩展
.load ./csv

CREATE VIRTUAL TABLE temp.t1 USING csv(filename='thefile.csv');
SELECT * FROM t1;

DateTime

-- epoch to datetime
select datetime(1580000000,'unixepoch');
-- 添加时区
select datetime(1580000000,'unixepoch','localtime');
-- datetime to epoch
select strftime('%s', datetime(1580000000,'unixepoch','localtime'));
-- 当前 epoch
select strftime('%s', 'now');

Notes

The SQLite Query Optimizer Overview

  • WHERE 条件分析
    • 索引选择
  • BETWEEN 优化
    • 转换为 >= <=
    • 与索引判断
  • OR 优化
    • 相同列语意上可转换为 IN
    • 不同列 OR 需要按 Cost 选择
  • LIKE 优化
    • 前缀索引
  • Skip-Scan 优化
    • 条件不以索引最左列开始
    • 尝试限定最左列条件来利用索引
    • 例如当最左列只有固定几个值的时候
  • JOIN
    • JOIN 重排序
    • 基于 SQLITE_STAT 选择顺序
    • 通过 CROSS JOIN 控制查询
  • 多个索引的选择
    • 基于统计
    • 使用 +a = 4 的方式来暗示不实用 a 的索引
    • 范围查询
  • 覆盖索引
    • 全表扫描时选择包含 rowid 的索引
  • ORDER BY 优化
    • 尝试使用符合 ORDER BY 要求的索引
  • 通过索引进行部分 ORDER BY
    • 包含多个 ORDER BY 时
  • 拉平子查询
    • 将子查询优化为 JOIN
  • 协程执行子查询
    • 部分子查询可以与当前查询并行执行
  • MIN/MAX 优化
    • 如果列是某索引的最左列可以使用索引
  • 自动索引
    • 当查询没有索引时,可能会在语句执行期间自动创建一个索引。
    • 创建索引 O(NlogN) 全表扫描 O(N)
  • 下推优化/Push-Down Optimization
    • 一个子查询无法被平整为外部查询,可尝试将外部查询的条件下推到子查询中。
  • LEFT JOIN Strength Reduction Optimization
    • 有时一个 LEFT JOIN 可以转换为一个普通的 JOIN,只要两者结果相同。
    • if any column in the right-hand table of the LEFT JOIN must be non-NULL in order for the WHERE clause to be true, then the LEFT JOIN is demoted to an ordinary JOIN.
  • 忽略 LEFT JOIN
    • 有时 LEFT JOIN 可以完全呗忽略
      • 飞聚合查询
      • DISTINC 查询或使用 ON/USING 来限制 JOIN 只匹配一列
      • LETF JOIN 右边表的列未在外部查询使用

The Next-Generation Query Planner

.help

.mode column
指令描述默认
.backup ?DB? FILE备份数据库(默认为 main)到 FILE
.bail on|off错误时停止OFF
.binary on|off二进制输出OFF
.clone NEWDB克隆现有的数据库到 NEWDB
.databases例举添加的数据库名和文件
.dbinfo ?DB?显示数据库状态信息
.dump ?TABLE? ...以 SQL 的形式转储数据库
如果指定了表,则只转储匹配 LIKE 模式的表.
.echo on|off命令回显
.eqp on|off自动执行 EXPLAIN QUERY PLAN
.exit退出
.explain ?on|off?使用适合 EXPLAIN 的输出模式
如果未指定参数,则为打开
.fullschema显示 sqlite_stat 的 schema 和内容
.headers on|off显示头
.help显示该信息
.import FILE TABLE导入 FILE 内容为 TABLE
.indexes ?TABLE?显示所有索引
如果指定了表,则只显示匹配 LIKE 模式的表.
.limit ?LIMIT? ?VAL?显示或更改 SQLITE_LIMIT 的值
.log FILE|off日志, FILE 可以为 stderr/stdout
.mode MODE ?TABLE?设置输出模式
-ascii 行列使用 0x1F 和 0x1E 分隔
-csv 逗号分隔的值
-column 左对齐列 (参见 .width)
-html HTML <table> 代码
-insert Insert 语句 TABLE
-line 每行只有值
-list 使用 .separator 分隔的值
-tabs 制表符分割的值
-tcl TCL list 元素
.nullvalue STRING使用 STRING 来替代 NULL 值
.once FILENAME输出下一个 SQL 指令到 FILENAME
.open ?FILENAME?便于现有数据库并打开 FILENAME
.output ?FILENAME?发送输出到 FILENAME 或 stdout
.print STRING...显示 STRING
.prompt MAIN CONTINUE修改提示符
.quit退出
.read FILENAME执行 FILENAME 中的 SQL
.restore ?DB? FILE恢复 DB(默认 "main") 的内容到 FILE
.save FILE将内存数据库写入到 FILE
.scanstats on|off打开或关闭 sqlite3_stmt_scanstatus() 监测
.schema ?TABLE?显示 CREATE 语句
如果指定了表,则只显示匹配 LIKE 模式的表.
.separator COL ?ROW?修改列和行的分隔符,会影响输出和 .import
.shell CMD ARGS...在系统 shell 中执行 CMD ARGS...
.show显示当前的各种设置
.stats on|off统计开关
.system CMD ARGS...在系统 shell 中执行 CMD ARGS...
.tables ?TABLE?显示表名
如果指定了表,则只显示匹配 LIKE 模式的表.
.timeout MS打开被锁表的超时时间
.timer on|offSQL 计时器开关
.trace FILE|off输出每个 SQL 语句
.vfsname ?AUX?输出 VFS 栈
.width NUM1 NUM2 ...设置 "column" 模式的宽度,负值为右对齐

Deeper

https://dzone.com/articles/how-sqlite-database-works

Node

# pre gyp 默认从 s3 下载 - 可指定镜像
yarn add sqlite3 --sqlite3_binary_host_mirror=https://npm.taobao.org/mirrors/sqlite3/
// 获取版本
const db = new Database(':memory:');
db.serialize(() => {
db.each('select sqlite_version() as version', (err, row) => {
console.log(`sqlite version ${row.version}`);
});
});
db.close();

Java

  • xerial sqlite-jdbc Usage

UDF

Build

# http://www.sqlite.org/年/sqlite-amalgamation-版本号.zip
# 2013-04-12 3.7.16.2
curl -O http://www.sqlite.org/2013/sqlite-amalgamation-3071602.zip

# 正常编译
gcc shell.c sqlite3.c -lpthread -ldl -lm
# 单线程 - sqlite shell 不需要线程支持
gcc -DSQLITE_THREADSAFE=0 shell.c sqlite3.c -ldl -lm
# 单线程 无扩展
gcc -DSQLITE_THREADSAFE=0 -DSQLITE_OMIT_LOAD_EXTENSION shell.c sqlite3.c
# 单线程 无扩展 静态 - 方便移植
gcc -DSQLITE_THREADSAFE=0 -DSQLITE_OMIT_LOAD_EXTENSION -static shell.c sqlite3.c

# 交叉编译
# arm-none 无法编译 - 缺少 stdlib.h, stdlb.h
arm-none-eabi-gcc -DSQLITE_THREADSAFE=0 -DSQLITE_OMIT_LOAD_EXTENSION -static shell.c sqlite3.c

DEV

pragma

PRAGMA pragma_list;     -- 查看所有属性
PRAGMA compile_options; -- 编译选项 https://www.sqlite.org/compile.html
PRAGMA module_list; -- 模块列表
PRAGMA stats; -- 统计新秀
PRAGMA freelist_count; --

PRAGMA database_list; -- 数据库
PRAGMA table_list; -- 表
PRAGMA function_list;

-- PRAGMA table_info(table-name);
-- PRAGMA table_xinfo(table-name);
-- PRAGMA foreign_key_list(table-name);
-- PRAGMA index_list(table-name);
-- PRAGMA index_info(index-name);
-- PRAGMA index_xinfo(index-name);
PRAGMA table_info(sqlite_schema); -- 表信息
PRAGMA table_xinfo(sqlite_schema);

PRAGMA optimize; -- 执行优化
  • synchronous
    • 0 | OFF
      • 不调用 fsync
      • 应用崩溃安全,系统崩溃不安全
    • 1 | NORMAL
      • sync 少于 FULL
    • 2 | FULL
      • VFS xSync
      • 非 WAL 时使用
    • 3 | EXTRA
      • 同步 rollback journal
  • journal_mode - 控制 -journal 文件
    • DELETE - 事务结束删除 rollback journal
    • TRUNCATE - 使用 truncaate 而非 删除 - 有的 fs 会更快
    • PERSIST - 保留 - 再次写入就行覆盖
      • journal_size_limit=SQLITE_DEFAULT_JOURNAL_SIZE_LIMIT=32K
    • MEMORY
    • WAL - 使用 WAL 而非 rollback journal
      • 产生 -shm-wal 文件
    • OFF - 禁用 rollback journal
      • 没有 rollback 能力
  • wal_autocheckpoint=1000 - 自动执行 wal_checkpoint(PASSIVE)
    • 当 WAL N 页后 auto-checkpoint
    • 控制 -wal 文件大小
    • 设置为 <= 0 禁用 - 通过 wal_checkpoint 手动触发
  • wal_checkpoint(mode)
    • PASSIVE - 默认 - 不等待 reader
    • FULL - 阻塞读
    • RESTART - 同 FULL,且确保之后读会 RESTART log file
    • TRUNCATE - 同 RESTART,且 truncate 文件
  • locking_mode
    • NORMAL - 默认
    • EXCLUSIVE
  • auto_vacuum - 需要在创建表之前指定,创建表会添加额外信息用于追踪
    • 0 | NONE - 默认 - 需要执行 VACUUM 来回收空间
    • 1 | FULL - 每次 commit 移动空页到文件尾部,然后 truncate - 会导致文件碎片化
    • 2 | INCREMENTAL
      • incremental_vacuum=N
      • 当 freelist 达到给定的 page 后就行 auto vaccum
  • temp_store - 存储 temporary indices / tables 逻辑
    • 0 | DEFAULT
    • 1 | FILE
    • 2 | MEMORY;
  • automatic_index=true - SQLite 会基于查询自动创建索引优化后续查询
  • page_size=4096 - 范围 512 - 65536
    • 修改需要 vacuum 才能生效
  • max_page_count
  • page_count - 当前的页数
  • mmap_size=0 - https://sqlite.org/mmap.html
    • 不一定会提升性能
    • 0 禁用
  • cache_size=2000
    • 2000 -> 2000xpage_size -> 2000x4k=8M
  • foreign_key_check - 是否校验外键约束
  • ignore_check_constraints
  • encoding=UTF-8
  • query_only - 只读模式
  • quick_check
    • 比 integrity_check 少检查 unique
  • read_uncommitted
  • recursive_triggers
  • reverse_unordered_selects
  • secure_delete
    • 开启后删除会置 0
  • schema_version - int32 at offset 40 - schema cookie
  • writable_schema
  • shrink_memory - 释放内存
  • 额外信息
  • https://www.sqlite.org/pragma.html
-- 修改 page_size
pragma page_count;
pragma page_size 65536;
vacuum;
pragma page_count;

sqlite_stat1

CREATE TABLE sqlite_stat1(tbl,idx,stat);
-- v3.6.18 2009-09-11
CREATE TABLE sqlite_stat2(tbl,idx,sampleno,sample);
-- v3.7.9 - 2011-11-01
CREATE TABLE sqlite_stat3(tbl,idx,nEq,nLt,nDLt,sample);
-- v3.8.1 - 2013-10-17
CREATE TABLE sqlite_stat4(tbl,idx,nEq,nLt,nDLt,sample);
  • tbl - 表名
  • idx - 索引
  • sample - 采样数据 - BLOB

WAL

  • 优点
    • 大多情况都会更快
    • 读 不阻塞 写,写 不阻塞 读
    • 大多为顺序 IO
    • 更少 fsync
  • 缺点
    • 基于共享内存 - 不能在 NFS 这种跨节点 FS 使用
    • 进入 WAL 后不可以修改 page_size
    • 产生额外的 -wal, -shm 文件
  • https://www.sqlite.org/wal.html

syntax

attach

attach expr as name;
detach name;

json

upsert

format

  • page
    • lock-byte
    • freelist - 不活跃的页 - linked list 形式
      • freelist trunk
      • freelist leaf
    • b-tree
      • table b-tree interior
      • table b-tree leaf
      • tindex b-tree interior
      • tindex b-tree leaf
    • payload overflow
    • pointer map
  • -journal - 回滚日志
    • page number in db
    • 原始 page 内容
  • -wal
    • checkpoint 序列号
    • frames - 24-byte header+page
  • -shm - wal-index
  • https://www.sqlite.org/fileformat2.html

vacuum

  • 重建数据库文件,释放不需要的磁盘空间
  • VACUUM INTO 类似 backup,且生成的 db 是 VACUUM 后的
-- VACUUM [schema] [INFO filename];

query

Versions

  • SQLite v3.38.0 - 2022-02-22
    • 默认包含 json
    • json ->, ->>
  • SQLite v3.37.2
    • -DSQLITE_ENABLE_JSON1 - json1
  • SQLite v3.37.0 - 2021-11-27
    • STRICT Tables
  • SQLite v3.23.0 - 2018-04-02
    • 识别 TRUE, FALSE -> 1, 0
  • SQLite v3.12.0 - 2016-03-29
    • page_size 1024 -> 4096
  • SQLite v3.8.2 - 2013-12-06
    • WITHOUT ROWID
  • SQLite v3.8.0 - 2013-08-26
    • 部分索引
  • SQLite v3.7.17 - 2013-05-20
    • mmap
  • SQLite v3.7.0 - 2010-07-21
    • WAL