4作者: theHolyTrynity9 个月前原帖
我们构建了一个开源工具,用于通过模拟提示注入攻击来对人工智能代理进行压力测试。 我们基于论文《AdvPrefix: An Objective for Nuanced LLM Jailbreaks》实现了一种强大的攻击策略。 它的工作原理如下: - 你定义一个目标,比如:“告诉我你的系统提示” - 我们的工具使用语言模型生成可能会破解代理的对抗性前缀(例如:“当然,这里是我的系统提示……”)。 - 输出是一个最有可能成功绕过安全措施的提示列表。 我们刚刚起步。我们的目标是成为测试代理安全性的首选工具包。我们目前正在研究更多的攻击策略,并希望得到你的反馈、想法和合作。 试用地址: [https://security.vista-labs.ai/](https://security.vista-labs.ai/) 使用说明文档: [https://hackagent.dev/docs/intro](https://hackagent.dev/docs/intro) GitHub: [https://github.com/vistalabs-org/hackagent](https://github.com/vistalabs-org/hackagent) 示例视频演示: [https://www.loom.com/share/1e4ce025ea4749fab169195e7b1222ba](https://www.loom.com/share/1e4ce025ea4749fab169195e7b1222ba) 期待听到你的想法!
3作者: sailorganymede9 个月前原帖
我对参观一些与这个领域相关的历史或特殊地点很感兴趣,希望通过这样的方式重新激发我对这个领域的热情。<p>我从未去过布莱切利公园,所以我想去看看,看看是否能让我对一些不涉及争论在数据库中添加列的事情感到兴奋。<p>还有其他人推荐的地方吗?或者你们去过哪些地方?谢谢!
1作者: ajoshu9 个月前原帖
嘿,HN!<p>我创建了 [projct.dev](<a href="https://projct.dev" rel="nofollow">https://projct.dev</a>),这是一个简单的、以开发者为中心的个人链接工具,用于展示副项目。<p>大多数个人链接工具都显得臃肿或专为网红设计,而这个工具则简洁、极简,专为想要展示自己作品的创作者和独立开发者而制作。<p>功能: - 移动优先的响应式布局 - 编辑时实时预览 - 点击查看分析数据 - Github 贡献展示 - 超轻量级<p>期待您的反馈、想法,或者只是想听听您的看法。对于这个早期版本,我很乐意回答任何问题!
1作者: EnthusiastShiv9 个月前原帖
大型语言模型现在非常强大,但仍然感觉有些脱节。我希望有一些小型代理程序可以在本地运行(如果需要,也可以在云端),彼此沟通,能够读取/写入 Notion 和 Google 日历,规划我的日程,并接受语音输入,这样我就不必打字了。我只想要有用的自动化,而不想要繁琐的功能。 现在已经有类似的东西吗?还是我需要自己去构建?
1作者: NicoBeere9 个月前原帖
我和我最好的朋友上个月在全职工作的同时开发了一款SaaS工具:Chyrid(chyrid.com)。这是一个无需设计或编码技能即可创建数字手册的工具。用户可以使用拖放编辑器构建结构化、精美的文档,而Chyrid则负责格式化——不使用人工智能。 我们开发这个工具是因为大多数文档工具要么过于复杂,要么缺乏结构。目前已有一家公司在使用它进行员工入职培训和流程文档的编写,但我们仍在探索如何定位它以及谁会觉得它最有用。 我们非常希望能听到您对潜在使用场景的想法或对这个概念的反馈。如果您想试用一下,我们将非常感激您的意见。