查看原文
其他

第10期吐槽:说删库跑路的都是骗子,千万别信,他们有的宝贝你可能没有!

digoal PostgreSQL码农集散地 2024-07-08

文中参考文档点击阅读原文打开, 同时推荐2个学习环境: 

1、懒人Docker镜像, 已打包200+插件:《最好的PostgreSQL学习镜像

2、有web浏览器就能用的云起实验室: 《免费体验PolarDB开源数据库

3、PolarDB开源数据库内核、最佳实践等学习图谱:  https://www.aliyun.com/database/openpolardb/activity 

关注公众号, 持续发布PostgreSQL、PolarDB、DuckDB等相关文章. 


第10期吐槽:完蛋,没有这个功能真的要删库跑路!

1、产品的问题点

  • 没有Query级别的闪回功能, 当发生DML误操作后, 恢复数据比较困难.

2、问题点背后涉及的技术原理

  • flashback query属于查询“数据”在过去某个时刻的状态, 实现方法举例:

  • 需要有旧的tuple版本, 以及事务提交或回滚状态, 事务结束时间的信息.

    • 这种实现方法需要保留旧版本和事务结束时间, 可能导致UNDO数据膨胀.

  • 或: 采用快照, 通过快照+WAL回放的形式回到过去状态.

    • 这种实现方法需要支持快照, 可能导致额外的copy on write开销

  • 最好仅仅针对重点表开启闪回功能.

3、这个问题将影响哪些行业以及业务场景

  • 所有行业

4、会导致什么问题?

  • 发生DML误操作后, 依赖备份+时间点恢复功能. 恢复数据比较困难.

5、业务上应该如何避免这个坑

  • 数据备份+WAL归档, 时间点恢复后将数据导出, 再导入到生产环境.

  • 使用触发器, 将DML的UNDO操作记录下来, 使用UNDO语句回滚.

  • 使用快照文件系统, 例如ZFS, 在ZFS上建立物理流复制从库, 当需要恢复时通过快照+WAL回放的形式回到过去状态. 将数据导出, 再导入到生产环境.

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 管理难道较大, 一般开发人员不懂, 较为复杂度

7、数据库未来产品迭代如何修复这个坑

  • 内核层支持: 表级别多版本管理, 同时使用UNDO回滚段代替数据文件内存储多版本.

  • 内核层支持, partial PIRT. 表级别的数据文件+WAL时间点恢复.

  • PolarDB开源版本支持flashback query可以试试 

文章中的参考文档请点击阅读原文获得. 


欢迎关注我的github (https://github.com/digoal/blog) , 学习数据库不迷路.  

近期正在写公开课材料, 未来将通过视频号推出, 欢迎关注视频号:


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存