返回首页
最新
我构建了一个小型离线照片搜索工具,使用本地视觉-语言模型(NexaAI Qwen3-VL-4B)来描述图像,并利用句子转换器生成语义搜索的嵌入向量。<p>该工具完全在设备上运行(无云端,无API密钥)。<p>GitHub 仓库:<a href="https://github.com/pankaj4152/smart-photo-finder" rel="nofollow">https://github.com/pankaj4152/smart-photo-finder</a><p>您可以通过以下步骤进行尝试:
1. 运行 `python app.py`
2. 选择“处理图像”
3. 选择“搜索图像”<p>欢迎对架构、性能和改进提出反馈。
大型语言模型(LLMs)让我们觉得可以学习任何东西,但聊天只是其中一种基本形式。我正在尝试构建一些界面,使我们能够与人工智能深入探讨某个主题。这些界面可以让我们快速整合理解,避免在冗长的聊天记录中迷失,同时能够快速放大和缩小信息,减少诸如上下文处理等繁琐的工作。我很好奇你是否对此感兴趣,并希望听到你的反馈!请试试看(是免费的)。
单次调用架构:通过单一的API调用优化速度和成本效率,以处理整个生成-审核-修正周期。