返回首页
最新
我一直在开发一个轻量级的身份验证流程,旨在为不想处理复杂身份系统或收集个人数据的SaaS应用、课程和小型平台提供服务。<p>Toqen提供基于二维码的登录、临时访问通行证和TOTP验证,而无需存储用户信息。我们的目标是创建一个简单、以隐私为优先的替代方案,取代电子邮件登录和密码。<p>该系统使用Cloudflare Turnstile进行反机器人保护,并运行在边缘优先的架构上。我希望社区能对架构、安全考虑和潜在问题提供反馈。<p>演示链接:<a href="https://www.toqen.app/demo" rel="nofollow">https://www.toqen.app/demo</a>
请阅读关于ChatGPT在一个简单逻辑难题上失败的内容,最新模型
https://files.catbox.moe/pn3fiw.md<p>这台机器的智能已经无可救药,却仍受到OPENAI的赞扬。
有一个名为 startupideasdb.com 的平台,你可以在谷歌上搜索。基本上,他们从互联网上收集了超过12,000个问题陈述!这真是太棒了!
我相信Cursor刚刚推出了两个主要功能:调试和设计。
我对IDE的需求有一定的了解,但在发布之前我无法完全表达出来。现在它已经上线,所有的一切都变得非常清晰。
在我看来,编程的未来将是实时的:调试、编码、设计等等。虽然这个想法并不新颖,但不同之处在于,现在这一切将是完全自主的。
最近,我在一个功能上工作,需要重新设计我们用Django模板和普通JavaScript构建的遗留流程的一部分。理论上,对于当前的模型来说,这不应该是一个困难的任务。但它们在生成正确的输出时遇到了困难,我认为有两个原因:
设计本质上很难仅用文本表达。
模型在生成新代码方面表现出色,但在修改大型现有代码库时却不那么理想。
老实说,我发现更新遗留用户界面的最佳工作流程是直接基于截图操作。我只需截取现有用户界面和预期更改的截图,然后要求模型编写与该设计相匹配的代码,考虑到现有设计的上下文。通过这种方式,模型能够更快地理解上下文。
有了这个新的设计功能,我想象这个整个过程会变得更快,因为我可以直接在浏览器上进行编辑,模型只需编写出预期的结果。这正是我一直想要的——一个在后台运行的自定义无头Puppeteer,实时观察我所做的事情,并帮助我进行设计。
然后就是调试。我一直更喜欢日志而不是传统的调试器。我真正想要的是在运行时像ELK解析器那样的东西,能够理解我的日志,并在系统运行时指出何时偏离预期路径。
我在浏览成千上万张照片时感到沮丧,想找到“拿着相机的人”或“海滩上的日落”。文件名毫无用处,手动标记从未发生,而云解决方案又妨碍了隐私。
我使用NexaAI的本地视觉语言模型(Qwen3-VL)和语义嵌入构建了这个工具。它的工作原理如下:
1. VLM生成每张图像的自然语言描述(一次性处理)
2. 描述转换为384维嵌入
3. 通过余弦相似度按意义搜索(对1000张图像的搜索时间少于100毫秒)
一切都在本地运行。您的照片不会离开您的设备。没有API费用。
技术现实:CPU处理速度较慢(最初每张图像约需20-30秒),但之后搜索是即时的。对于个人收藏,JSON数据库运行良好;如果有超过1万张图像,您可能需要使用FAISS。
这是一个原型,但它有效,并解决了我面临的一个实际问题。欢迎反馈。
该项目是为NexaAI的Builder Bounty计划而构建的(设备端AI,优先考虑隐私)。
演示视频: [https://youtu.be/YVkPa-aJpEo](https://youtu.be/YVkPa-aJpEo)
Medium文章: [https://medium.com/@pankajgoyal4152/building-smart-photo-finder-ai-powered-search-that-actually-understands-your-photos-ed016b840f0f](https://medium.com/@pankajgoyal4152/building-smart-photo-finder-ai-powered-search-that-actually-understands-your-photos-ed016b840f0f)