返回首页
最新
每个人都在训练人工智能拒绝执行某些任务。我们对一个模型进行了后期训练,以便突破这些限制。
Anthropic 和 OpenAI 的公开模型明确设定了防护措施,以拒绝执行有攻击性的任务。而它们针对网络安全的模型则仅限于企业使用。这使得中小企业和中型市场面临重大安全漏洞。
在网络安全领域,人工智能既可以作为对抗工具,也可以作为防御工具。最糟糕的情况是,只有对手能够访问这些工具。
与此同时,大多数现有的人工智能网络安全工具仅仅是外壳。问题在于,它们仍然继承了基础模型的所有防护措施,因此会拒绝执行某些操作。
在这个项目中,我们对一个特定模型进行了后期训练,使用了十年的夺旗比赛数据。这个模型不会向所有人开放,但我们确实相信,负责任的中小企业和中型公司也需要访问这些工具,以识别其系统中的关键漏洞,而不仅仅是大型企业。
我们开发了两种通过命令行界面(CLI)运行的模式:
• 安全扫描:对您本地代码库的只读审计,检查漏洞。它仅报告可以与特定文件和行关联的内容,因此您不必在基于直觉的发现中苦苦挣扎。
• 渗透测试:一种主动的对抗模式,试图在沙盒环境中攻破实时系统。它通过运行漏洞利用并展示所发送的请求及代码返回的响应来证明每个漏洞,而不是提供一个置信度评分。目前处于限制访问状态。
为了展示扫描的功能,我们将其指向了 Anthos 银行,发现了转账路径中的整数溢出问题:金额是一个整数,而金额加费用可能会溢出为负数,因此余额检查通过,您可以转移并不存在的资金。此外,还有常见的身份验证和秘密问题。(Anthos 银行是谷歌的开源银行。它是一个已知的应用程序,其中一些故意设置得很弱,这正是重点:您可以克隆它并重新运行扫描,而不是仅仅相信截图。)
关于工具的工作原理:
除了模型,我们还构建了一个支持该模型的框架。该框架在一个多代理群体上运行:一个协调者将任务分配给并行运行的子代理,每个子代理负责一部分,然后合成一份报告。
CLI 是一个本地二进制文件(brew/curl)。它在本地读取您的代码,然后通过 TLS 将上下文发送到我们的推理 API,您可以通过 tcpdump 看到确切的流出内容及其去向。安装是免费的;您可以免费运行一次扫描,最多可处理 200 万个令牌,超出部分需要付费。
为了完全透明,这是 Cosine(YC W23)的一个产品。
值得讨论的是:工具的安全性,例如,域验证是一种证明控制权的方法,但不一定证明许可。考虑到这一点,您将如何限制渗透测试工具的访问?
作为我们EDAcation项目的一部分,我们正在为VSCode开发一个扩展,以便于数字硬件设计。我们构建了一个FPGA查看器,以集成到VSCode中,但考虑到VSCode本质上只是一个网页浏览器,我们想,为什么不将其作为一个独立的网站发布呢?所以我们就这样做了,您可以在链接的网页上亲自查看结果。
您可以检查各种iCE40和ECP5 FPGA,并可视化各种布局与布线(PnR)结果。我们包含了一些示例设计,但如果您熟悉Nextpnr,您也可以上传自己的设计。
所有数据都保留在本地,查看器完全在您的浏览器中运行。芯片渲染器是用Rust编写并编译为WebAssembly的。如果您有兴趣,可以查看代码,我们所有的项目都是完全开源的。
我们的目标是让数字硬件设计变得更加易于访问,这个项目正好符合这一使命。期待听到您的意见!
launchreel.dev<p>作为一名专注于产品开发的独立创始人,进行内容创作以推广产品并不容易。制作视频意味着需要进行屏幕截图、撰写字幕、将文本转换为配音,并将这些元素组装成画面,这个过程耗时数小时。由于这是一个重复性的工作,逐渐成为了瓶颈。<p>因此,我开发了launchreel。<p>它的工作原理如下:<p>你只需粘贴一个网址(最多3个,外加最多6张图片/视频)。它会应用视觉API提取视觉参考、文本,并利用大型语言模型(LLM)编织故事。它会撰写字幕和配音文本。LLM会提供视频计划,包括画面视觉效果、画面时长、字幕和配音文本。<p>然后,一个人工智能代理将这些计划组装成视频,并添加音乐、配音和字幕。<p>它会调整视频尺寸以适应不同平台——HackerNews、X、ProductHunt、博客、Instagram、Facebook和IndieHackers。它还会撰写帖子内容,并提供可下载的视频。<p>它遵循每个平台的规范(例如,HackerNews不允许使用夸张词汇),但无法保证符合所有的社区行为规范。配音使用文本转语音(TTS),可以选择男性/女性温暖的声音,或不使用配音。文件限制:图片≤5MB,视频≤25MB,总计≤60MB,时长约30秒至5分钟。<p>希望能收到关于每个平台语气模型的反馈,以及元素提取在你的页面上是否有效。请联系:founder@deepship.dev<p>欢迎免费试用。