git暂存区

我们知道git commit提交命令是基于暂存区的,如果修改了工作空间的内容,必须使用git add /git rm等把修改添加到暂存区,否则无法提交。
git暂存区

创新互联建站是一家专注于网站设计制作、成都网站建设与策划设计,根河网站建设哪家好?创新互联建站做网站,专注于网站建设十年,网设计领域的专业建站公司;建站业务涵盖:根河等地区。根河做网站价格咨询:18980820575

在.git目录下有个index文件,这个就是暂存器文件,当我们使用修改暂存区命令的时候,这个文件就会更新。

1.暂存区的内容

暂存区中存储的是git blob对象的引用,以及blob对象的一些路径信息。我们可以使用 git ls-files --stage

$ git ls-files --stage
100644 72943a16fb2c8f38f9dde202b7a70ccc19c52f34 0       fas.txt
100644 f910c723c9bbc92b2d61c094859e68bbf7215ab2 0       hello.txt
100644 b08a2810d8a4542f350f650435f506c6c81ca9b2 0       src/hello.txt

2.暂存区二级制分析

当我们使用notepad++使用十六进制格式打开该文件,内容如下:
git暂存区
其对应的格式为:

   | 0                         | 4                       | 8                          | C                       |
   |-----------------------|----------------------|------------------------|----------------------|
0 | DIRC                  | Version             | File count            | ctime       ...       |  0
   | ...                       | mtime                                             | device                |
2 | inode                 | mode                | UID                      | GID                    |  2
   | File size             | Entry SHA-1                                           ...                 |
4 | ...                                                  | Flags                   | Index SHA-1 ...  | 4
   | ...                                                                                                            |

git暂存区

  • 44 49 52 43: DIRC. 固定的头部
  • 00 00 00 02 :格式版本
  • 00 00 00 03:暂存器文件的个数,我们有三个

后面的内容是每一个文件的信息列表。如果有多个文件则依次按照下面的顺序读取

  • ctime:占八位,是文件的创建时间。
  • mtime:占八位,是文件的修改时间
  • 四个字节的device,inode,mode,UID,GID.这些属性是为了不用比较文件内容,更好的检测文件是否变更。
  • File size:四个字节的文件大小。
  • Entry SHA-120:个字节的blob对象的ID(SHA-1),指向git的blob对象。
  • Flag对象占用四个字节,也就是32bit位。其中第一个bit位为是否有效标志,第二个bit位为扩展标志位。第三和第四bit位表示该暂存块的状态,主要表示合并的状态。 0:正常文件状态没有合并冲突1 : base 2: ours 3: theirs。第五到第十六bit位表示文件的路径长度,例如值是00 07,那么表示后面的七个字节都是路径信息。后面的两个字节只有在第二个bit为为扩展的时候才存在。
  • 文件名和路径信息:其长度取决于Flag对象中的第五到第十六bit位的值。其中的路径信息使用utf-8编码(默认,最好不要修改),例如保存的路径为"临时目录/hello.txt",那么其二进制结果为“e4 b8 b4 e6 97 b6 e7 9b ae e5 bd 95 2f 68 65 6c 6c 6f 2e 74 78 74”。
    String s = "临时目录/hello.txt";
        byte[] bytes = s.getBytes("utf-8");
        for (byte b : bytes) {
            System.out.print(Integer.toHexString(b & 0xFF) + " ");
        }
        输出:e4 b8 b4 e6 97 b6 e7 9b ae e5 bd 95 2f 68 65 6c 6c 6f 2e 74 78 74
  • 后面跟着1-8个字节的00,为了文件的索引内容的个数是8的倍数,这个是必须有的,至少有1个,如果文件的内容恰好是8的倍数,那么就会有8个00字节。

最后的二十位为以上内容的校验和。
参考:https://stackoverflow.com/questions/4084921/what-does-the-git-index-contain-exactly

3.为什么存在暂存区

分段提交,可能不想把整个工作空间的修改内容提交,加入暂存区就可以分段提交
https://www.zhihu.com/question/19946553


文章题目:git暂存区
地址分享:http://myzitong.com/article/ggesoh.html