2作者: Salim995 个月前原帖
大家好!我是Salim,一名内容营销人员,我正在开发一个名为[quizquestions.org](http://quizquestions.org)的网站。这是我打造最大的测验题库的项目。 这个网站并不是一个测验网站,而是为制作测验的人提供的资源库。 你看,我偶尔会制作测验。虽然有很多测验制作工具,但可用的测验资源却不多,而且大多数资源只是一些博客。因此,我想创建一个更结构化的网站来满足这个需求。 目前网站提供的功能包括: - 测验卡片:你可以以测验的格式获取测验题,而不是浏览它们 - 测验分类: [测验分类](https://www.quizquestions.org/category) - AI题目生成器: [题目生成器](https://www.quizquestions.org/question-generator) - 指南博客页面: [指南](https://www.quizquestions.org/guides) - 保存问题:以便以后用于创建测验 - 发送问题:发送你自己的问题 - 分类统计信息: [统计信息](https://www.quizquestions.org/statistics) 这是我的第一个网站,欢迎任何反馈!
23作者: henryl5 个月前原帖
大家好,我是Henry,Span的联合创始人兼首席技术官(CTO)([https://span.app](https://span.app))。今天我们推出了AI代码检测器,这是一款可以在浏览器中试用的AI代码检测工具。 AI生成代码的爆炸式增长给工程组织带来了一些奇怪的问题。像Cursor和Copilot这样的工具几乎被全球每个组织使用,但每种代码生成工具在报告使用情况时都有其独特的方式。有些甚至根本不报告使用情况。 我们的观点是,随着AI在软件构建中的深入应用,代币支出将开始与薪资支出竞争,因此理解如何提高熟练度、改善投资回报率(ROI)以及分配与AI工具相关的资源,将变得至少与人才方面的平行流程同样重要。 真正获取AI生成代码的可见性是极其困难的。然而,这正是客户向我们提出的第一需求。 因此,我们从头开始构建了一种新方法。 我们的AI代码检测器由span-detect-1驱动,这是一种经过数百万个AI和人类编写的代码样本训练的先进模型。它以95%的准确率检测AI生成的代码,并将其与投入生产的特定代码行关联。在Span平台内,它将为团队提供AI对开发速度、质量和投资回报率的真实影响的清晰视图。 它确实有一些局限性。最显著的是,它目前仅支持TypeScript和Python代码。我们正在增加对更多语言的支持:Java、Ruby和C#是下一个目标。今天的准确率约为95%,我们也在努力提高这一点。 如果你想试用一下,可以在这里运行一段代码片段([https://code-detector.ai](https://code-detector.ai)),大约五秒钟就能得到结果。我们还有一个更具叙述性的微网站([https://www.span.app/detector](https://www.span.app/detector)),我的市场团队说我必须分享。 期待听到你们的想法,无论是对工具本身的看法,还是你们自己的体验。我也会在评论区待着,回答大家的问题。
25作者: segmenta5 个月前原帖
嗨,HN!我们是 Arjun、Ramnique 和 Akhilesh,Rowboat 的创始人(<a href="https://www.rowboatlabs.com">https://www.rowboatlabs.com</a>),这是一个 AI 辅助的集成开发环境(IDE),用于构建和管理多智能体系统。使用 Rowboat,您可以构建确定性自动化代理(例如,自动总结电子邮件)以及更具智能体特征的系统(例如,会议准备助手或客户支持机器人)。 以下是一些示例: - 会议准备助手:<a href="https://www.youtube.com/watch?v=KZTP4xZM2DY" rel="nofollow">https://www.youtube.com/watch?v=KZTP4xZM2DY</a> - 客户支持助手:<a href="https://www.youtube.com/watch?v=Xfo-OfgOl8w" rel="nofollow">https://www.youtube.com/watch?v=Xfo-OfgOl8w</a> - Gmail 和 Reddit 助手:<a href="https://www.youtube.com/watch?v=6r7P4Vlcn2g" rel="nofollow">https://www.youtube.com/watch?v=6r7P4Vlcn2g</a> Rowboat 是开源的(<a href="https://github.com/rowboatlabs/rowboat" rel="nofollow">https://github.com/rowboatlabs/rowboat</a>),并且拥有一个不断壮大的社区。几个月前,我们首次在 Show HN 上发布了它(<a href="https://news.ycombinator.com/item?id=43763967">https://news.ycombinator.com/item?id=43763967</a>)。 今天,我们推出了一个重大更新,并推出了云服务。我们增加了对数百种工具(如 Gmail、Github 和 Slack)的内置工具集成、与文档和 URL 的 RAG(检索增强生成)功能,以及根据外部事件触发助手的功能。 我们的云版本包含开源 IDE 的所有功能,但可以立即运行,无需设置或 API 密钥。为了庆祝发布,我们提供 $10 的免费使用额度,您可以立即开始构建,而无需输入任何信用卡信息。付费计划从每月 $20 开始,提供额外模型(OpenAI、Anthropic、Gemini,更多模型即将推出)和更高的使用限制。 越来越多的人认为某些任务更适合由单个代理处理(<a href="https://news.ycombinator.com/item?id=45096962">https://news.ycombinator.com/item?id=45096962</a>),而其他任务则可以通过多智能体系统获得更高的准确性(<a href="https://www.anthropic.com/engineering/multi-agent-research-system" rel="nofollow">https://www.anthropic.com/engineering/multi-agent-research-system</a>)。这种差异通常取决于任务的范围:像编程这样的专注任务适合单个代理,而处理电子邮件、Slack 和 LinkedIn 等多个领域的任务则更适合分配给多个代理。多智能体系统还可以避免上下文污染,因为当大型语言模型(LLM)被要求处理无关任务时会失去焦点。此外,清晰划分责任使得每个代理更容易进行测试、调试和改进。 然而,将工作拆分为多个代理并正确设置它们的提示是具有挑战性的。OpenAI 和其他公司已经发布了适用于不同场景的有效模式(<a href="https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf" rel="nofollow">https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf</a>)。我们在 OpenAI 的代理 SDK 基础上添加了代理抽象,以支持这些模式。这些包括可以在需要时决定交接给另一个代理的用户代理;执行内部任务的任务代理;以及以确定性方式调用一系列代理的管道。 Rowboat 的副驾驶(“Skipper”)了解这些模式,并已经植入了经过测试的模式,例如客户支持机器人的经理-员工设置、自动文档摘要的管道,以及将网络搜索与 RAG 结合的多智能体工作流。它可以: - 从高层请求构建多智能体系统,并决定如何在代理之间分配工作 - 编辑代理指令,以使用 Composio 工具或任何连接的 MCP 服务器进行正确的工具调用 - 观察您的实验室聊天,并根据您的测试改进代理 我们将智能体系统视为一个光谱。在一端是具有少量 LLM 调用的确定性工作流;在另一端是完全智能的系统,其中 LLM 做出所有控制流决策——我们专注于这个光谱的这一端,同时在现实世界的助手用例中仍然允许必要的确定性控制。我们故意避免使用流程图风格的编辑器(如 n8n),因为在构建和维护高度智能的系统时,它们变得难以管理。 我们期待听到您的想法!