查看原文
其他

用 Git 操作的数据库?这个项目火了!

鱼皮 程序员鱼皮 2022-08-14

Git 是一个开源的分布式版本控制系统,可以敏捷高效地管理代码,让项目代码支持同时存在多个不同的版本和分支,是程序员在项目开发中的必备工具。

版本控制

除了代码文件可以进行版本控制之外,数据其实也可以版本控制

今天,Dolt 项目荣登 GitHub 趋势榜榜首,该仓库的介绍是 “Git for Data”,一个面向数据的 Git,目前已收获了几千个 star。

GitHub 趋势

下面我们来简单了解下 Dolt 项目。

什么是 Dolt?

根据官方介绍,Dolt 是一个基于 Git 协议的开源 SQL 数据库,使用 Golang 语言编写。

首先它和 MySQL 关系型数据库一样,用于存储和管理数据,具有表、视图等概念,支持数据的增删改查等操作。

对 Dolt 执行数据库操作

然而更棒的是,它提供了一个命令行工具,完美支持所有的 Git 命令,并且语法完全相同!允许用户像使用一个 git 仓库一样对数据进行 fork、clone、branch、merge、push 和 pull 等操作。

Dolt 命令行

当你提交数据到存储库时,Dolt 会自动存储提交日志,比如本次修改的内容、作者、提交时间等,从而实现了对数据单元的版本控制,便于多人对数据进行协作和优化。

Dolt 日志

比如一个班的同学在使用公共数据做实验时,可能需要针对实验提供不同的数据,这个时候就可以用 Dolt 来进行数据的版本控制。

数据版本控制

你还可以随时查看上次提交的数据与当前数据的区别,一旦有人不小心把公共数据改错了,发现当前数据有异常时,可以轻松地回滚和修复问题。

查看不同版本的数据区别

Dolt 简直就是 Git 和 MySQL 的孩子!

这也不像啊

关于 Dolt 的使用方法,官方已经给了详细的教程,还是比较简单的。

DoltHub

就像 Git 拥有 GitHub 作为代码的开源远程托管平台一样,Dolt 官方也提供了相应的远程托管平台,即 DoltHub。

DoltHub 允许用户将自己的 Dolt 数据库免费托管到他们提供的云存储服务中,便于管理和协作。你可以像浏览 GitHub 一样浏览 DoltHub,在这里发现优秀的数据集,比如 Coronavirus(冠状病毒)、Google Open Images 等,拿去实验和数据分析都是极好的!

DoltHub

虽然数据版本控制的概念在很早之前就已经被提出和落地,但是 Dolt 的热门应该能够帮助更多同学了解和使用这类系统,我还是很期待他的发展。

⬇️ 点击下方阅读原文查看项目


往期推荐

千万别强制停机!我嘴都气歪了!【文末红包】

Java 开发者鱼皮每天都干啥?【文末红包】

让你的 GitHub 秒变高大上!



您好,我是鱼皮,20 届本科毕业加入腾讯,是一名热爱分享技术干货的全栈工程师。
在校期间带工作室建设几十个网站,拿过国家奖学金、挑战杯国奖、上海市优秀毕业生,也曾在字节跳动实习,有段创业经历,并成功落户上海。
未来很长,希望能和大家共同进步,作为职场萌新,虚心接受前辈点化。
感谢您的关注,欢迎添加我的微信 liyupi66 交流。
创作不易,请给鱼皮加个星标点赞、在看 支持哦!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存