Mayx的博客

https://mabbs.github.io/

https://mabbs.github.io/atom.xml (RSS订阅地址)

一次找回GitHub上被删除仓库的经历

在GitHub中寻找踪迹也许是非常简单的事情…… 起因前段时间，有人和我聊天的时候提到了Brainfuck语言，让我回想起了高中时写的演讲稿。那时候我在演讲时也介绍了Brainfuck语言。对于Brainfuck的解释器，各种语言都可以实现，不过我当时为了方便理解用了一个在GitHub Pages上的网站，用可视化的方式演示了它的运行过程，效果很不错。现在既然聊到了，自然就想分享一下这个演示的网站，但我正想打开时，发现网站已经404了😰。首页都打不开，看样子是完全退出GitHub了……那么我想找到这个网站的想法就无法实现了吗？不过GitHub有些有意思的特性也许能帮助我找回这个网站。 GitHub的特性在GitHub中，一个普通的仓库可能没有什么特别的，也许就是服务器上的一个文件夹。但是当仓库被其他人Fork的时候就不一样了，在执行Fork时，显然GitHub不会完整复制整个仓库。否则，同一个仓库在服务器上会占用双倍空间，这显然不合理。另外，想想Git的结构：它由提交对象和分支指针构成，每次提交都有唯一的Hash值且不会冲突。因此可以推测，GitHub在实现Fork时，所有被Fork的仓库可能共享同一个对象库，而每个用户仓库只保存指针，这样所有仓库只会占用增量空间，而不会存储重复内容。 Linux内核仓库做个示例。提交的Hash值（顺便一说只要值唯一，和其他的提交不冲突，短的Hash值也可以），果不其然能找到刚刚修改的内容，这样一来，只要GitHub和任意一个Linux仓库的Fork还存在，这个提交就永远存在了😝。找回仓库那么接下来找回之前网站的方案就很简单了，我只要找到网站仓库的任意一个Fork，然后只要知道最新的提交Hash，我就可以还原最新的仓库了。Fork倒是好找，随便搜一下就能找到一个。这个Fork的最新提交是2016年，但要想找到我当年演讲的版本至少到2018年之后。不过这个Hash值也不太好找，虽然理论上爆破短Hash值也可以，但是感觉太麻烦了，没有那个必要，所以我干脆直接去互联网档案馆看看能找到的最新的仓库页面吧，这样我就能找到它的Hash值了，然后我再把Fork仓库的地址和Hash拼到一起，就看得到最新代码了。 git fetch origin <commit-hash> git reset --hard <commit-hash> git push origin master 最终我就获得了包含最新代码的Brainfuck可视化演示了🎉。结局后来我才知道，原来有一个专门的组织Software Heritage会保存所有代码，根本没必要搞这些花里胡哨的操作😂，像这个仓库也是能很轻易在上面找到，这下以后知道了，再遇到类似情况就可以直接去Software Heritage查找，而不必在互联网档案馆上找线索瞎折腾了🤣。

Mayx的博客

一次找回GitHub上被删除仓库的经历

关于ZIP Quine与自产生程序的探索

在Tilde社区的游玩体验

用Service Worker实现一个反向代理

使用Cloudflare制作自动更新的网站预览图

一次服务器被入侵的经历

使用XSLT为博客XML文件编写主题一致的样式

近期对博客的修改与优化记录

Mac Studio M3 Ultra使用体验

关于LLM上限的探索

Mayx的博客

一次找回GitHub上被删除仓库的经历

关于ZIP Quine与自产生程序的探索

在Tilde社区的游玩体验

用Service Worker实现一个反向代理

使用Cloudflare制作自动更新的网站预览图

一次服务器被入侵的经历

使用XSLT为博客XML文件编写主题一致的样式

近期对博客的修改与优化记录

Mac Studio M3 Ultra使用体验

关于LLM上限的探索

Mayx的博客

一次找回GitHub上被删除仓库的经历

关于ZIP Quine与自产生程序的探索

在Tilde社区的游玩体验

用Service Worker实现一个反向代理

使用Cloudflare制作自动更新的网站预览图

一次服务器被入侵的经历

使用XSLT为博客XML文件编写主题一致的样式

近期对博客的修改与优化记录

Mac Studio M3 Ultra使用体验

关于LLM上限的探索