用 JGit 通过 Java 来操作 Git java中的git
lipiwang 2024-10-15 18:43 12 浏览 0 评论
JGit 是一个由 Eclipse 基金会开发、用于操作 git 的纯 Java 库。它本身也是 Eclispe 的一部分,实际上 Eclipse 的插件 EGit 便是基于 JGit 的。如果你像我这样有使用代码来操作 git 的需求,那就准备好拥抱 JGit 吧。目前来看别的竞品没它靠谱。
概念
从用户指南的概念一节中可以看到,JGit 的基本概念如下:
- Git 对象(Git Objects):就是 git 的对象。它们在 git 中用 SHA-1 来表示。在 JGit 中用AnyObjectId和ObjectId表示。而它又包含了四种类型:二进制大对象(blob):文件数据树(tree):指向其它的 tree 和 blob提交(commit):指向某一棵 tree标签(tag):把一个 commit 标记为一个标签
- 引用(Ref):对某一个 git 对象的引用。
- 仓库(Repository):顾名思义,就是用于存储所有 git 对象和 Ref 的仓库。
- RevWalk:该类用于从 commit 的关系图(graph)中遍历 commit。晦涩难懂?看到范例就清楚了。
- RevCommit:表示一个 git 的 commit
- RevTag:表示一个 git 的 tag
- RevTree:表示一个 git 的 tree
- TreeWalk:类似 RevWalk,但是用于遍历一棵 tree
准备环境
让我们从一个最典型的用例开始吧。首先在/tmp/jgit/repo中创建一个 git 仓库:
mkdir -p /tmp/jgit/repocd /tmp/jgit/repogit init --bare
再创建一个 clone 该仓库的客户端:
cd /tmp/jgit/git clone repo clientcd client
输入git status应该能够看到 Initial commit,这样环境就没有问题了。然后提交一个文件,给仓库里来点库存:
echo hello > hello.txtgit add hello.txtgit commit -m "hello" git push
动手
获取仓库
动手时间。新建 Maven 工程,往 pom.xml 中增加 dependency,最后的 pom.xml 看起来就像这样:
<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>org.ggg.jgit</groupId> <artifactId>helloJgit</artifactId> <version>1.0-SNAPSHOT</version> <dependencies> <dependency> <groupId>org.eclipse.jgit</groupId> <artifactId>org.eclipse.jgit</artifactId> <version>4.8.0.201706111038-r</version> </dependency> </dependencies> </project>
让我们先尝试 clone 一下这个仓库。因为 client 分为已经存在以及重新 clone 的两种,所以我们在 src/main/java 中新增一个RepositoryProvider接口,用两种不同实现以示区分:
public interface RepositoryProvider { Repository get() throws Exception; }
并实现之:
public class RepositoryProviderCloneImpl implements RepositoryProvider { private String repoPath; private String clientPath; public RepositoryProviderCloneImpl(String repoPath, String clientPath) { this.repoPath = repoPath; this.clientPath = clientPath; } @Override public Repository get() throws Exception { File client = new File(clientPath); client.mkdir(); try (Git result = Git.cloneRepository() .setURI(repoPath) .setDirectory(client) .call()) { return result.getRepository(); } } }
新增一个HelloJGit主程序类:
public class HelloJGit { private static RepositoryProvider repoProvider = new RepositoryProviderCloneImpl("/tmp/jgit/repo", "/tmp/jgit/clientJava"); public static void main(String[] args) throws Exception { try (Git git = new Git(repoProvider.get())) { git.pull().call(); } } }
直接运行HelloJGit的main函数,ls /tmp/jgit/应该就能看到新 clone 出来的clientJava文件夹了。
cd /tmp/jgit/clientJavalsgit status
我们当然不希望总是在使用的时候才重新 clone 一个仓库,因为当仓库很大的时候可能会非常耗时。让我们在client中再提交一个 commit:
echo hello2 > hello2.txtgit add hello2.txtgit commit -m "hello again"git push
然后尝试直接从刚刚 clone 下来的 clientJava 中创建 Repository:
public class RepositoryProviderExistingClientImpl implements RepositoryProvider { private String clientPath; public RepositoryProviderExistingClientImpl(String clientPath) { this.clientPath = clientPath; } @Override public Repository get() throws Exception { try (Repository repo = new FileRepository(clientPath)) { return repo; } } }
然后把HelloJGit的repoProvider实例替换为RepositoryProviderExistingClientImpl:
private static RepositoryProvider repoProvider = new RepositoryProviderExistingClientImpl("/tmp/jgit/clientJava/.git");
注意这次的路径中需要加上.git才行。再次运行HelloJGit的main函数,便可以通过ls /tmp/jgit/clientJava看到新提交的hello2.txt文件了。
常用操作
接下来尝试git add、git commit和git push这几个最常用的命令。让我们往clientJava中添加一个hello3.txt文件并提交。如下修改HelloJGit:
public static void main(String[] args) throws Exception { try (Repository repo = repoProvider.get(); Git git = new Git(repo)) { createFileFromGitRoot(repo, "hello3.txt", "hello3"); git.add() .addFilepattern("hello3.txt") .call(); git.commit() .setMessage("hello3") .call(); git.push() .call(); } } private static void createFileFromGitRoot(Repository repo, String filename, String content) throws FileNotFoundException { File hello3 = new File(repo.getDirectory().getParent(), filename); try (PrintWriter out = new PrintWriter(hello3)) { out.println(content); } }
虽然操作多了,但是有了Repository和Git对象之后,看起来它们的实现都非常直观。运行main函数之后,可以到client文件夹中校验一下:
cd /tmp/jgit/clientgit pullcat hello3.txtgit log
在我的机器上运行git log,可以得到:commit 7841b8b80a77918f2ec45bcedb934e2723b16b5c (HEAD -> master, origin/master),以及另外两个 commit。有兴趣的读者们可以自行尝试其它的 git 命令。
其它对象
虽然上面两小节的内容对于普通需求来说已经大致上够用了,但是在概念一节中介绍到的其它概念,如 Git 对象、引用等还没有出场呢。我们再新建一个WalkJGit的类,在main函数中编写如下代码:
try (Repository repo = repoProvider.get()) { Ref ref = repo.getAllRefs().get(Constants.HEAD); ObjectId objectId = ref.getObjectId(); System.out.println(objectId); }
这回,Ref和ObjectId都出现了。在我的机器上,运行以上程序打印出来了 AnyObjectId[7841b8b80a77918f2ec45bcedb934e2723b16b5c]。我们可以看到,取得HEAD的Ref,其ObjectId其实就是在client文件夹中运行git log之后结果。除了HEAD以外,repo.getAllRefs()返回的Map实例中还有refs/heads/master和refs/remotes/origin/master,在目前的情况下,它们的ObjectId完全相同。那么如何获取其它的 commit 呢?那就是RevWalk出场的时候。把main函数中的内容替换为如下代码:
try (Repository repo = repoProvider.get()) { Ref ref = repo.getAllRefs().get(Constants.HEAD); try (RevWalk revWalk = new RevWalk(repo)) { RevCommit lastCommit = revWalk.parseCommit(ref.getObjectId()); revWalk.markStart(lastCommit); revWalk.forEach(System.out::println); } }
可以看到RevWalk本身是实现了Iterable接口的。通过对该对象进行循环,就可以获取所有的 commit 的RevCommit对象。可以到client文件夹确认一下,这些 SHA-1 字符串应该跟刚才git log命令的结果相同。RevCommit对象本身含有这个 commit 的所有信息,所以可以如下打印出来:
revWalk.forEach(c -> { System.out.println("commit " + c.getName()); System.out.printf("Author: %s <%s>\n", c.getAuthorIdent().getName(), c.getAuthorIdent().getEmailAddress()); System.out.println("Date: " + LocalDateTime.ofEpochSecond(c.getCommitTime(), 0, ZoneOffset.UTC)); System.out.println("\t" + c.getShortMessage() + "\n");});
这样看起来是不是很有git log的感觉呢?需要注意的是,RevWalk线程不安全,并且像Stream那样,只能使用一次。如果想要再来一次,就需要重新创建RevWalk对象或是调用其reset方法(还得重新markStart!)。
要想看到每个 commit 中有什么内容,那就需要用到TreeWalk了,它的思路和RevWalk类似。尝试如下代码:
for (RevCommit commit : revWalk) { System.out.println("\ncommit: " + commit.getName()); try (TreeWalk treeWalk = new TreeWalk(repo)) { treeWalk.addTree(commit.getTree()); treeWalk.setRecursive(true); while (treeWalk.next()) { System.out.println("filename: " + treeWalk.getPathString()); ObjectId objectId = treeWalk.getObjectId(0); ObjectLoader loader = repo.open(objectId); loader.copyTo(System.out); } } }
这样便可以显示仓库在每个 commit 时候的状态了。如果需要 diff,那么还将需要用到DiffEntry等类,本文就不再赘述了,有兴趣的读者可以参考这个类。
相关推荐
- 软件测试|MySQL CROSS JOIN:交叉连接的详细解析
-
简介在MySQL数据库中,CROSSJOIN是一种用于生成两个或多个表的笛卡尔积的连接方法。CROSSJOIN不需要任何连接条件,它将左表的每一行与右表的每一行进行组合,从而生成一个包含所...
- 「MySQL笔记」left join-on-and 与 left join-on-where 的区别
-
1.摘要关于这两种写法的重要知识点摘要如下:left-join时,即使有相同的查询条件,二者的查询结果集也不同,原因是优先级导致的,on的优先级比where高on-and是进行韦恩运算连接...
- MySQL中的JOIN——联合查询的基本语法
-
MySQL中的JOIN指令用来将两个或多个表中的数据进行联合查询,根据连接条件来匹配记录,从而得到需要的结果集。在MySQL中,常见的JOIN类型包括INNERJOIN、LEFTJOIN和RIGH...
- MySQL 中的 CROSS JOIN:强大的连接工具
-
CROSSJOIN在MySQL里是一种挺特别的连接操作,它能弄出连接表的笛卡尔积。这就是说,要是表A有m行,表B有n行,那ACROSSJOINB的结果就会有m*n...
- 大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?
-
大厂必问:MySQL三表JOIN操作的解析与性能优化策略,效率又如何?点击关注,开启技术之旅!大家好,这里是互联网技术学堂,无论你是一名程序员、设计师、还是对技术充满好奇心的普通人,都欢迎你加入...
- 面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)
-
MySQL的JOIN查询优化是提升数据库性能的关键环节。以下是综合多个技术文档的核心优化策略,按优先级和实现难度分类:一、索引优化:性能提升的基础为连接字段建立索引确保参与JOIN的列(通常...
- Flink中处理维表关联技术实现路径
-
在Flink中处理维表关联大体氛围TableSQLLookupJoin和DataStream算子函数,主要技术实现路径:I.FlinkSQL/TableAPI中的Lookup...
- 深入剖析Zookeeper原理(一)整体设计
-
1.ZK集群架构设计与特性1.ZK集群架构设计:ZK主要分为三种角色:Leader(领导者):一个Zookeeper集群同一时间只会有一个实际工作的Leader,它会发起并维护与各Follwer及...
- 多种负载均衡算法及其Java代码实现
-
首先给大家介绍下什么是负载均衡负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。负载均衡,英...
- 一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?
-
1.概念ribbon是一款客户端负载均衡器,用于微服务之间的负载均衡。首先,什么是客户端负载均衡?如图,ribbon可以通过注册中心获取服务列表,然后自己执行自己的负载均衡策略来决定要访问哪个微服务,...
- Step by Step之腾讯云短信-验证码实践
-
在商城小程序和前端上线用了一阵子之后,用户提出了体验提升的需求,如忘记密码、绑定用户、快捷注册等,作为业界最佳实践的短信验证码登录、重置密码和注册等功能开发也就提上日程了,本文就以重置密码为例,将验证...
- 10分钟入门响应式:Springboot整合kafka实现reactive
-
Springboot引入Reactor已经有一段时间了,笔者潜伏在各种技术群里暗中观察发现,好像scala圈子的同仁们,似乎对响应式更热衷一点。也许是因为他们对fp理解的更深吧,所以领悟起来障碍性更少...
- 使用java随机生成有个性的用户名,LOL地名+水浒传,合计2808个
-
*随机生成用户名*取水浒传108好汉名字*取LOL地名26个,组合而成*一共可以生成2808个不同特色的用户名如果你在上网的时候,用户名难取的话,这里有很多可选择的用户名,现提供100个...
- 深入理解Math.random()的概率分布特性
-
直接上源码/***Returnsa{@codedouble}valuewithapositivesign,*返回一个带符号的double类型的数字,说人话就是返回一个非负...
- 编程英文 - 创建/生成/构建 (create/generate/build)
-
在软件开发中,create、generate和build这三个词经常被用到,它们都与"创造"或"产生"某些东西有关,但在具体使用场景和含义上有所不同。基本含义creat...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- 软件测试|MySQL CROSS JOIN:交叉连接的详细解析
- 「MySQL笔记」left join-on-and 与 left join-on-where 的区别
- MySQL中的JOIN——联合查询的基本语法
- MySQL 中的 CROSS JOIN:强大的连接工具
- 大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?
- 面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)
- Flink中处理维表关联技术实现路径
- 深入剖析Zookeeper原理(一)整体设计
- 多种负载均衡算法及其Java代码实现
- 一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?
- 标签列表
-
- maven镜像 (69)
- undefined reference to (60)
- zip格式 (63)
- oracle over (62)
- date_format函数用法 (67)
- 在线代理服务器 (60)
- shell 字符串比较 (74)
- x509证书 (61)
- localhost (65)
- java.awt.headless (66)
- syn_sent (64)
- settings.xml (59)
- 弹出窗口 (56)
- applicationcontextaware (72)
- my.cnf (73)
- httpsession (62)
- pkcs7 (62)
- session cookie (63)
- java 生成uuid (58)
- could not initialize class (58)
- beanpropertyrowmapper (58)
- word空格下划线不显示 (73)
- jar文件 (60)
- jsp内置对象 (58)
- makefile编写规则 (58)