返回首页
最新
我开发了一个工具,可以分析你暂存的 git 变更,利用嵌入和层次聚类按语义相似性对它们进行聚类,并为每个聚类创建单独的提交。
问题是:我经常会因为进入工作状态而做出“超级提交”,其中包含不相关的更改,结果导致我忘记提交大量变更。
它的工作原理如下:
- 使用 tree-sitter 将差异解析为语义块
- 生成嵌入(OpenAI text-embedding-3-small)
- 使用单链接层次聚类进行聚类
- 提供交互式树状图用户界面以调整聚类阈值
- 为每个聚类创建一个提交
目前仅支持 Mac(使用自编写的 https 客户端和 kqueue),但如果有兴趣,我很乐意添加跨平台支持。同时也计划支持本地 LLM/嵌入。
期待反馈!
为创始人和工程经理构建了一款工具,让他们无需每天查看 GitHub 就能获得项目进展的可见性。该工具连接到您的代码库,自动跟踪提交和拉取请求,并每周向 Slack 或电子邮件发送汇总报告。它还可以作为 Slack 机器人使用——您可以直接在工作区询问“上周发布了什么”或“哪些内容在审核中”。网址:https://gitmore.io(一个代码库免费使用)这真的能为您节省时间吗?
我创建了InsideStack,以便更容易找到高质量的技术和软件文章。
<p>为什么要这样做?
- 网络上充斥着AI生成的内容
- 企业发布了大量带有偏见的文章
- 搜索结果往往更注重互动而非质量
- AI生成的文章摘要无法将流量引回原作者
<p>InsideStack让您可以:
- 通过语义搜索在精选的RSS源中搜索
- 订阅、收藏以及关注主题或作者
<p>目前,仅包含少量源,但我每天都在添加更多。欢迎提供高质量RSS源的建议和任何反馈!
文件来自 https://www.justice.gov/epstein/files/DataSet%201.zip
大小 1251.06MB,哈希值 6d23adffac9736b8e46fd195b64000cb
https://web.archive.org/web/20251219213848if_/https://www.justice.gov/epstein/files/DataSet%201.zip
大小 1261.36MB,哈希值 c54a12403fbb352113aa544934b5d156
有什么变化?