返回首页
最新
我最初将这个功能添加到我的网站上是为了加快视频编辑的过程。去年我开始了一个YouTube频道,对于一些较长的视频,依赖YouTube或Capcut进行转录是很麻烦的,而Whisper是开源的。Capcut最近也更新了他们的条款与条件,表示如果你使用他们的应用,他们就拥有你的内容,所以我取消了我的订阅。
我还有一个用例是将我的Claude提示录制为音频,转录后再粘贴到我的终端中。我主要在命令行界面(CLI)上工作(使用Claude、FFmpeg、Whisper),但我想制作一个浏览器版本。
这里并不是在重新发明轮子,只是使用Huggingface/Xenova的Transformers.js在浏览器中通过后台工作线程运行Whisper。
你可以在这里查看演示:<a href="https://www.youtube.com/watch?v=ICLOvAq9vKE" rel="nofollow">https://www.youtube.com/watch?v=ICLOvAq9vKE</a>
如果你有兴趣自己构建这个功能,Huggingface上有很多示例:<a href="https://huggingface.co/collections/Xenova/transformersjs-demos-64f9c4f49c099d93dbc611df" rel="nofollow">https://huggingface.co/collections/Xenova/transformersjs-demos-64f9c4f49c099d93dbc611df</a>
这会消耗大量的令牌,但基本思路是在 ./llm/cache 中创建一个缓存,然后生成多个子代理,首先查看缓存,如果学到任何新知识,则将其写入缓存。
GPT-Reviewer:基于AI的代码审查GitHub Action
我创建了一个GitHub Action,能够自动审查拉取请求,使用GPT-4o或Claude,通过内联评论强制执行自定义项目规则。
主要特点:
- 通过.project-rules.md配置文件强制执行自定义规则
- 支持OpenAI的GPT-4o和Anthropic的Claude
- 使用.ignore文件进行类似.gitignore的文件过滤
- 具有特定行级反馈的内联PR评论
- 除了添加API密钥、规则文件和(可选的)忽略文件外,零配置设置
工作原理:该Action获取PR的差异,解析新增行,并将其与项目规则一起发送给您选择的AI提供商。AI返回结构化的JSON反馈,并作为内联评论发布在需要关注的特定行上。这是一次性提示。
示例项目规则:
## 安全
- 永远不要硬编码API密钥或秘密
- 验证所有用户输入
## 代码风格
- 使用描述性的变量名称(无论这意味着什么)
- 将拼写错误标记为警告
设置非常简单:
1. 添加.project-rules.md文件,包含您的编码标准
2. 创建一个在PR事件上运行的GitHub工作流
3. 将您的AI提供商API密钥添加到仓库的秘密中
该Action仅审查新代码的添加,保持噪音低,同时确保代码库的一致性。它对于希望自动执行编码标准和安全实践的团队特别有用。
该工具使用Python构建,利用GitHub API进行PR集成,并使用unidiff解析更改。AI提供商被抽象化,使得在OpenAI和Anthropic之间切换或添加新提供商变得简单。
GitHub: [https://github.com/vayqerlukashakkarainen/gpt-reviewer](https://github.com/vayqerlukashakkarainen/gpt-reviewer)
希望能收到已经在开发工作流中使用AI的团队的反馈,或者任何其他意见。我个人喜欢“单任务”AI应用程序,它只执行被告知的任务。目前我对AI的应用研究非常感兴趣。
有趣的是:
我使用OpenCode生成了这篇文章的大部分内容,OpenCode是一个命令行代理,可以进行编码和交流。但它似乎也可以用来生成项目的精彩总结 :)