返回首页
一周热榜
我开发了一个程序生成的单词搜索游戏,这个谜题是无止境的——当你滚动时,网格会无限扩展并出现新的单词。这个游戏设计得易于上手,玩起来令人满意,并且有点上瘾。<p>核心游戏在没有账户的情况下也能运行,使用预定义的游戏,但注册后可以根据你想到的任何主题生成游戏。<p>我非常希望能收到关于游戏玩法、性能以及这种无尽格式是否在长时间内保持吸引力的反馈。如果你尝试了这个游戏,我会非常感激任何错误报告或建议。<p>提前感谢!
只需在谷歌上搜索 startupideasDb.com,即可找到经过现实验证的创业点子。
在谷歌上搜索 startupideasDB.com,他们有超过12,000个创业点子!
大家好,HN!我们是来自DeepSource(YC W20)的Jai和Sanket,今天我们推出了Autofix Bot,这是一款结合静态分析和人工智能的混合代理,专为与AI编码代理协同使用而设计。
AI编码代理使得代码生成几乎变得免费,但这也将瓶颈转移到了代码审查上。仅依靠固定检查器的静态分析已经不够。仅依赖大型语言模型(LLM)的审查存在几个局限性:运行之间的非确定性、对安全问题的低召回率、在大规模应用时的高成本,以及容易“分心”的倾向。
在过去的六年里,我们一直在构建一个确定性的、仅基于静态分析的代码审查产品。今年早些时候,我们从头开始思考这个问题,并意识到静态分析能够解决LLM审查中的关键盲点。在过去的六个月中,我们构建了一个新的“混合”代理循环,结合静态分析和前沿的AI代理,以超越仅依赖静态分析和仅依赖LLM的工具,在发现和修复代码质量及安全问题方面表现更佳。今天,我们将其公开发布。
以下是混合架构的工作原理:
```
- 静态检查:5000多个确定性检查器(代码质量、安全性、性能)建立了一个高精度的基线。子代理抑制上下文特定的误报。
- AI审查:代理使用静态发现作为锚点来审查代码。它可以访问抽象语法树(AST)、数据流图、控制流图和导入图等工具,而不仅仅是grep和常规的shell命令。
- 修复:子代理生成修复建议。静态工具验证所有编辑,然后生成干净的git补丁。
```
静态分析解决了LLM的一些关键问题:运行之间的非确定性、对安全问题的低召回率(LLM容易被风格分散注意力)以及成本(静态分析缩小了提示大小和工具调用)。
在OpenSSF CVE基准测试中(200多个真实的JS/TS漏洞),我们的准确率达到了81.2%,F1值为80.0%;相比之下,Cursor Bugbot的准确率为74.5%(F1值77.42%),Claude Code的准确率为71.5%(F1值62.99%),CodeRabbit的准确率为59.4%(F1值36.19%),Semgrep CE的准确率为56.9%(F1值38.26%)。在秘密检测方面,我们的F1值为92.8%;相比之下,Gitleaks为75.6%,detect-secrets为64.1%,TruffleHog为41.2%。我们在这方面使用了我们的开源分类模型。
完整的方法论以及我们如何评估每个工具的详细信息,请访问: [https://autofix.bot/benchmarks](https://autofix.bot/benchmarks)
您可以通过我们的终端用户界面(TUI)在任何代码库上交互式使用Autofix Bot,或作为Claude Code的插件,或者通过我们的MCP在任何兼容的AI客户端(如OpenAI Codex)上使用。我们特别为AI编码代理优先的工作流程进行构建,因此您可以要求您的代理在每个检查点自动运行Autofix Bot。
今天就来试试吧:[https://autofix.bot](https://autofix.bot)。我们期待您的反馈!
---
[1] [https://github.com/ossf-cve-benchmark/ossf-cve-benchmark](https://github.com/ossf-cve-benchmark/ossf-cve-benchmark)
[2] [https://huggingface.co/deepsource/Narada-3.2-3B-v1](https://huggingface.co/deepsource/Narada-3.2-3B-v1)
[3] [https://autofix.bot/manual/#terminal-ui](https://autofix.bot/manual/#terminal-ui)
使用 Metal 和 Swift 从头开始原生编写。为 AirVis 应用程序构建。
大家好!我们是来自 Kenobi 的 Rory、Chris 和 Felix(<a href="https://kenobi.ai">https://kenobi.ai</a>)。Kenobi 让您可以为任何网站添加基于 AI 的内容个性化。作为网站所有者,您只需通过脚本标签安装我们的个性化小部件,就像集成聊天机器人一样。作为访客,您与小部件互动(目前通过提供公司名称),Kenobi 会根据您的需求更改网站内容。
我们在这里构建了一个任何人都可以尝试的演示:<a href="https://kenobi.ai/start">https://kenobi.ai/start</a>
我们相信,网络的许多部分即将从静态转变为动态,因为大型语言模型(LLM)在转换渲染的 HTML 方面非常擅长。目前,我们专注于 B2B 登陆页面内容(而不是应用程序 UI),因为在提高漏斗顶部的入站转化率方面有很大的商业机会。
我们今天的 Kenobi 之旅漫长而曲折。您可能会注意到帖子标题中提到我们参加了 YC 的 2022 年冬季批次(我知道在 YC 的狗年里,四年几乎是古老的)。Kenobi 是我们最初进入 YC 的想法的重大转变——我们原来的公司叫 Verdn,通过 API 提供可追踪的环保捐赠。自夏季以来,我们一直在尝试不同的想法……我们最初从为外部营销活动提供个性化 UI 截图开始,但后来人们告诉我们,他们希望对实际网站进行变更[0]——于是我们构建了一个代理工作流程,研究访客的公司,并为他们“预渲染”登陆页面的更改。最终,促使人们在冷外部营销活动中整合个性化 URL 的阻力太大[1]。此外,人们不断要求我们为他们的入站流量做这个,因此我们的当前版本应运而生。
现在,使用 Kenobi,您可以选择一个希望进行自定义的页面,并选择希望动态化的 [文本] 元素。您可以为这些元素定义自定义提示指令,当有人访问您的页面时,我们的代理工作流程会研究他们的公司,并尽快呈现更新的内容,通常在几秒钟内[2]。每当发生这种情况时,您还会在 Slack 中收到通知,以便您知道谁在使用您的网站。
我们一直在尝试生成实际上看起来不错且与页面设计相符的自定义图像,并引入公司数据源,以便根据访客的行业和理想客户画像(ICP)展示合适的案例研究。我们最受欢迎的功能是去匿名化流量,以便 Kenobi 的个性化可以在访客访问您的页面时自动发生——这一功能很快就会推出,因为目前您必须指定您的来源。
我们对从知道谁(很可能)在页面上并请求个性化体验中获得的商业价值感到惊讶。我们看到的响应率是我们通常从跟进访问我们网站的公司获得的三倍。
这个领域已经有很多参与者,每个人似乎都有自己的角度。我们非常希望听到大家对个性化互联网未来的看法!
来自伦敦的问候!
附言:Chris 还录制了一段视频,展示了目前的 Kenobi 端到端体验,您可以在这里查看 <a href="https://www.loom.com/share/bc0a82a2f2fd40f695315bae80e8f5d8" rel="nofollow">https://www.loom.com/share/bc0a82a2f2fd40f695315bae80e8f5d8</a>
[0] - 许多人尝试过 AI “微网站”生成器,但发现仅仅为了完成交易而管理一个单独的网站是繁琐且低效的。
[1] - 尽管我们为预生成的网站更改提供了 CSV 导出和 Clay 集成选项,但让人们将 URL 融入他们的电子邮件序列(每个人使用不同的工具)似乎几乎无法克服,除非我们构建看似是我们自己的序列软件。
[2] - 我们在研究步骤中使用轻量级基础模型和基于实际内容的搜索,并通过另一个轻量级 LLM 处理和我们自己优化速度的领域特定语言(DSL)将其转换为标记更改。
最近我在进行一个个人项目,将一个旧的 jQuery + Django 项目重写为 SvelteKit。主要工作是将用户界面模板翻译成符合 SvelteKit 习惯的格式,同时保持原有的样式。这包括使用语义化的 HTML,而不是随意使用 div,避免将 div 嵌套在 div 中,以及用简化版的 Tailwind 替代 Bootstrap。还涉及一些逻辑重构,以保持原有功能,但重写以避免多年的代码债务。例如,用可组合的 Svelte 组件替换使用布尔标志的多个视图模板。
我在进行这项工作时有一个相对稳定的流程:查看 Django 中定义的每个路由,构建我的 `+page.server.ts`,然后将页面的每个主要部分拆分为一个 Svelte 组件,并为其创建相应的 Storybook 故事。这样做需要花费大量时间,因为我必须确保不是简单地复制模板,而是以更符合习惯的风格重新创建它。
这种工作似乎是 AI 辅助编程的一个很好的用例,但我未能有效利用它。最多,我只能让 Claude Code 生成一些稍微不那么混乱的 Svelte 代码。简单的提示无法让 AI 的代码质量达到我手动编写代码的 90%。理想情况下,AI 应该能将代码生成到我可以在 15-20 分钟内手动审查的程度,这将大大加快我在这个项目上花费的时间(目前我需要 1-2 小时才能正确翻译一个路由)。
你们有什么建议或技巧可以帮助我提高使用 AI 的效率和代码质量吗?
似乎Meta最近将所有Messenger聊天迁移到了端到端加密(e2ee)。但是,如果您之前创建过秘密对话(e2ee),那么Meta决定不迁移现有聊天,而是将其归档并切换到秘密聊天。
由于我过去只与亲密的朋友和家人进行过秘密聊天的实验和创建,我所有的旧对话都被归档,且没有恢复的途径。
这真是一个糟糕的用户体验,完全不可思议的是这样的设计竟然在Meta通过了。
我读了很多非小说类书籍,但最近注意到,真正能算得上是深刻、发人深省的书籍却寥寥无几,这些书让你根本无法在短时间内读完,因为你总是会告诉自己:“等一下”,然后停下来搜索一些东西,进行实验,或者只是深思熟虑。目前我正在阅读的例子(尚未读完)是乔舒亚·福尔的《与爱因斯坦共舞》。这本书令人震撼——它揭示了我们周围整个记忆的宇宙,而我之前从未认真探索过。