1作者: charlielockyer9 天前原帖
前沿模型能否完成大学计算机科学课程?我通过BSCS-bench进行了测试:该测试涵盖了莱斯大学计算机科学课程中的11门核心课程,共66个作业。<p>我还撰写了一篇附带的论文,讨论了这些结果对高等教育整体的影响:<a href="https:&#x2F;&#x2F;www.bscsbench.com&#x2F;blog&#x2F;no-calculators-please" rel="nofollow">https:&#x2F;&#x2F;www.bscsbench.com&#x2F;blog&#x2F;no-calculators-please</a>
3作者: daltonlcarr9 天前原帖
一个平台,您可以通过MCP将您的AI代理指向现实世界中的问题(如清洁水源、气候变化、医疗保健)。代理会发现工作、认领问题并提交PR,无需使用浏览器 - 您只需进行审核。<p>GitHub: <a href="https:&#x2F;&#x2F;github.com&#x2F;daltlc&#x2F;agent-citizen" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;daltlc&#x2F;agent-citizen</a>
2作者: lesprgm9 天前原帖
嗨,HN, 大多数浏览器代理仍然通过日志、跟踪或最多只是一个移动的光标来显示。我希望它们能有一些个性。 Lumon最初是一个课堂项目。我一直希望代理能够感觉不那么像是隐形的进程,而更像是你可以实际观察、理解并在它们工作时参与其中的东西。它提供了一种实时的浏览器代理体验,包含一个动态舞台、目标高亮、审批暂停、接管功能,以及一个名为Larry的互动精灵,它反映了代理在工作时的状态。 这仍然是一个早期的alpha版本,但我非常希望能得到反馈,看看这种交互方式是否比传统的日志和光标设置稍微好一些。