我开发了一个名为cursor-tg的Telegram机器人,它让我可以通过手机使用Cursor Cloud Agents。<p>这个想法很简单:有时候我想启动一个代理运行、回复它,或者查看有什么变化,而不需要打开我的笔记本电脑。通过cursor-tg,我可以在Telegram中与Cursor代理进行对话,跟踪它们的进展,查看生成的差异/拉取请求,并在聊天中处理简单的审查操作。<p>我主要是为了远程/异步开发工作流程而制作这个工具,在我离开办公桌时,希望能够快速访问我的编码代理。<p>能够在任何地方(帮助代理)编写代码真的令人兴奋!<p>代码仓库:<a href="https://github.com/tb5z035i/cursor-tg" rel="nofollow">https://github.com/tb5z035i/cursor-tg</a>
返回首页
最新
一款竞争性的多人蛇游戏,AI控制的蛇由前沿的大型语言模型(如GPT、Claude、Gemini、Grok)编写,进行对抗。
人工智能驱动的个人财务分析器——完全在本地运行,无需云端,无需登录。<p>上传PDF / CSV / Excel格式的银行或信用卡对账单 → 人工智能提取并分类每一笔交易 → 互动仪表盘、消费洞察、定期付款检测以及与您的数据进行对话。
我希望能够让一个大型语言模型(LLM)“创建一个关于[主题]的词云”——LLM在研究方面表现出色,但在布局方面则稍显不足。<p>因此,我构建了一个专用的布局引擎。它在浏览器中运行,我还使用@napi-rs/canvas将其封装在一个小型的Go/Fiber服务器中,以将其作为MCP服务器和REST API暴露出来——这样任何LLM工具都可以直接调用它。<p>使用说明请见 <a href="https://word-cloud.net/ai.html" rel="nofollow">https://word-cloud.net/ai.html</a><p>欢迎反馈,地址为 <a href="https://github.com/pilotso11/word-cloud-net/" rel="nofollow">https://github.com/pilotso11/word-cloud-net/</a>
我开发了一个基于浏览器的工具,用于检测卫星图像中的物体,使用的是视觉语言模型(VLMs)。用户可以在地图上绘制多边形,并输入文本提示,例如“游泳池”、“油罐”或“公交车”。系统会逐块扫描选定区域,并将检测结果以GeoJSON格式投影回地图上。
工作流程如下:选择区域和缩放级别,将该区域划分为商用瓦片,使用提示通过VLM处理每个瓦片,将预测的边界框转换为地理坐标(WGS84),并将结果渲染回地图上。
在零样本设置下,对于明显的结构,该工具的效果相当不错。但对于被遮挡的物体,专门的检测器(如YOLO模型)处理得更好。
该工具有公开演示,无需登录。我主要希望获得关于检测质量的反馈、VLM与专门检测器之间的性能权衡,以及潜在的实际应用案例。