MySQL:InnoDB-表与文件

文件

参数文件

日志文件

  • redo log重做日志
  • undo log回滚日志
  • bin log二进制日志
  • error log错误日志
  • slow query log慢查询日志
  • relay log中继日志

redo log

作用

  • 确保事务的持久性
  • 防止在发生故障的时间点,尚有脏页未写入磁盘。在重启mysql服务的时候,根据redo log进行重做,从而达到事务的持久性这一特性。

内容

物理格式的日志,记录的是物理数据页面的修改的信息,其redo log是顺序写入redo log file的物理文件中去的。

对于数据库内所有被更改的数据块(segment),Oracle会把所有更改内容清楚记录在REDO日志缓冲中。 所谓所有更改内容,当然包括数据段,还有索引段和回滚段(rollback segment)。 数据库内任意数据块所发生的一个更改,会被写成一个变更向量(Change Vector)。 修改向量里包含了更改的数据块的地址与更新的数据。

产生时间

在事务开始之后逐步写入重做日志文件,而不一定是事务提交才写入重做日志缓存。

即使某个事务还没有提交,Innodb存储引擎仍然每秒会将重做日志缓存刷新到重做日志文件。

释放时间

当对应事务的脏页写入到磁盘之后,redo log的使命也就完成了,重做日志占用的空间就可以重用(被覆盖)。

log block

在InnoDB中重做日志都是以512字节存储的,即重做日志都是以块的方式保存的,即重做日志块,每块的大小为512字节。

重做日志块大小与磁盘扇区大小一样,都是512字节,因此写入可以保证原子性,不需要double write。

log group

重做日志组,其中有多个重做日志文件。

重做日志格式

header格式为:

  • redo_log_type:重做日志的类型。
  • space:表空间的ID。
  • page_no:页的偏移量。

LSN

Log Sequence Number,代表日志序列号,占用8字节并单调递增。其代表的含义有:

  • 重做日志写入的总量。
  • checkpoint的位置。
  • 页的版本。

恢复

InnoDB正在启动时不管上次数据库运行时释放正常关闭,都会尝试进行恢复操作。因为redo log记录的是物理日志因此恢复速度较快。

undo log

作用

  • 保存了事务发生之前的数据的一个版本,可以用于回滚
  • 可以提供多版本并发控制下的读(MVCC),也即非锁定读

内容

逻辑格式的日志,在执行undo的时候,仅仅是将数据从逻辑上恢复至事务之前的状态,而不是从物理页面上操作实现的,这一点是不同于redo log的。

什么时候产生
事务开始之前,将当前是的版本生成undo log,undo也会产生redo log来保证undo log的可靠性。

undo log存放于数据库内部的一个特殊段当中,称为undo段,位于共享表空间内。

什么时候释放
当事务提交之后,undo log并不能立马被删除,而是放入待清理的链表,由purge线程判断是否由其他事务在使用undo段中表的上一个事务之前的版本信息,决定是否可以清理undo log的日志空间。

回滚

删除记录仅仅是将记录的delete flag置为1,记录并没有被删除。真正的删除在purge操作中进行。

bin log

作用

  • 用于复制,在主从复制中,从库利用主库上的binlog进行重播,实现主从同步。
  • 用于数据库的基于时间点的还原。

内容

逻辑格式的日志,可以简单认为就是执行过的事务中的sql语句。但又不完全是sql语句这么简单,而是包括了执行的sql语句(增删改)反向的信息,也就意味着delete对应着delete本身和其反向的insert;update对应着update执行前后的版本的信息;insert对应着delete和insert本身的信息。

在使用mysqlbinlog解析binlog之后一些都会真相大白。因此可以基于binlog做到类似于oracle的闪回功能,其实都是依赖于binlog中的日志记录。

什么时候产生

事务提交的时候,一次性将事务中的sql语句(一个事物可能对应多个sql语句)按照一定的格式记录到binlog中。这里与redo log很明显的差异就是redo log并不一定是在事务提交的时候刷新到磁盘,redo log是在事务开始之后就开始逐步写入磁盘。

因此对于事务的提交,即便是较大的事务,提交(commit)都是很快的,但是在开启了bin_log的情况下,对于较大事务的提交,可能会变得比较慢一些。这是因为binlog是在事务提交的时候一次性写入的造成的,这些可以通过测试验证。

什么时候释放

binlog的默认是保持时间由参数expire_logs_days配置,也就是说对于非活动的日志文件,在生成时间超过expire_logs_days配置的天数之后,会被自动删除。

与redo log的不同

二进制日志的作用之一是还原数据库的,这与redo log很类似,很多人混淆过,但是两者有本质的不同

  • 作用不同:redo log是保证事务的持久性的,是事务层面的,bin log作为还原的功能,是数据库层面的(当然也可以精确到事务层面的),虽然都有还原的意思,但是其保护数据的层次是不一样的。
  • 内容不同:redo log是物理日志,是数据页面的修改之后的物理记录,bin log是逻辑日志,可以简单认为记录的就是sql语句。
  • 另外,两者日志产生的时间,可以释放的时间,在可释放的情况下清理机制,都是完全不同的。
  • 恢复数据时候的效率,基于物理日志的redo log恢复数据的效率要高于语句逻辑日志的binlog。

套接字文件

pid文件

表结构定义文件

InnoDB存储引擎文件

索引组织表

InnoDB中,表都是根据主键顺序组织存放的,这种存储方式的表称为索引组织表。每张表都会有一个主键,如果在创建表时没有显式定义主键则:

  • 首先判断表中是否有非空的唯一索引,如果有则该列即为主键。选择时根据定义索引的顺序。
  • 如果不符合上述条件,则自动创建一个6字节大小的指针。

InnoDB逻辑存储结构

从逻辑存储结构看,所有数据都被逻辑地存放在一个空间中,即表空间。表空间由段、区、页组成。

表空间

是逻辑结构的最高层,所有数据都存放在表空间中。默认情况下是一个共享表空间,即所有数据都存在该表空间中;如果启用了innodb_file_per_table则每张表内的数据可以放到一个单独的表空间。

如果是独立表空间,则只存放数据、索引、插入缓冲Bitmap页。其他信息依然在共享表空间中。

InnoDB行记录格式

InnoDB数据页结构

Named File Formats 机制

约束

视图

分区表

参考