2作者: mckinnonr大约 1 个月前原帖
我开发了Meter,以便随着时间的推移保持抓取的网站内容同步。<p>Meter首次使用大型语言模型(LLM)生成抓取计划,然后完全依赖原始HTTP请求(不使用Selenium,也不使用LLM)定期检测变化并重新提取内容。<p>我是在花了多年时间编写自定义抓取程序后开发这个工具的:解析网站,将输出连接到数据库,并随着页面的演变保持一切正常运行。Meter遵循我在实践中使用的相同方法——前期进行大量分析,然后持续进行快速、低成本的抓取。<p>我非常希望听到在这种情况下维护抓取任务或RAG管道的人的反馈。我期待对这个产品的任何意见,谢谢!
5作者: Aa123128大约 1 个月前原帖
NSFW AI图像打破了创造自由的障碍。与主流工具限制内容、地方模型需要昂贵硬件不同,NSFW AI图像提供了一种无缝的浏览器基础解决方案,支持无审查生成。 <p>主要特点:</p> <p>真正免费:没有付费墙、订阅或每日信用限制。</p> <p>无需登录:无需提供电子邮件或个人数据,即可立即开始生成。</p> <p>无需GPU:所有处理都在云端进行,允许您在任何笔记本电脑或手机上生成图像。</p> <p>无审查能力:特别调校以理解和可视化被标准AI服务屏蔽的提示。</p> <p>无论您是寻找Stable Diffusion的轻量级替代品,还是想快速测试提示,NSFW AI图像都提供了一个私密且易于访问的成人AI艺术平台。</p>
2作者: dapoadedire大约 1 个月前原帖
我构建了Synx,一个实时温湿度监测系统,结合了硬件、系统编程和现代网页开发。 <p>架构: - ESP8266 + DHT11传感器通过MQTT发送数据 - Go后端用于数据采集,并写入InfluxDB(时间序列数据库) - Next.js前端实现实时WebSocket更新(零延迟)和历史图表 <p>关键工程决策: - 选择MQTT而非HTTP以实现真正的实时推送 - 服务器端时间戳(ESP8266没有实时时钟) - 使用InfluxDB进行高效的时间序列存储 - 双通道:WebSocket用于实时数据,REST API用于历史数据 <p>作为一名初级Go工程师,我构建这个项目是为了超越CRUD应用,深入了解物联网协议、系统编程和实时数据流。 <p>非常希望能收到对架构选择的反馈!
2作者: kuack大约 1 个月前原帖
WebAssembly 使得在浏览器中进行复杂计算成为可能。我想看看是否可以将浏览器视作 Kubernetes 工作节点。 Kuack 是一个虚拟 Kubelet 提供者,它将 Kubernetes 工作负载调度到浏览器标签页。访问者的浏览器连接并报告其容量,成为临时工作节点。它看起来就像一个普通的 Kubernetes 节点——使用相同的 kubectl 命令、相同的 OCI 镜像、相同的工作流程。不同之处在于,Pods 在浏览器中执行,而不是在服务器上。通过多平台的 OCI 镜像,如果没有可用的代理,Kubernetes 可以回退到常规节点。 它设计用于短暂的、无状态的、CPU 密集型任务:来自真实网络的负载测试、本地数据预处理、边缘计算场景、机器学习任务等。 这并不是对您集群的替代方案——只是一个额外的选项,适用于那些可以从浏览器执行中受益的工作负载。
2作者: coredipper大约 1 个月前原帖
嘿,HN, 我一直在开发一个Python库和正式框架,以使代理型人工智能系统更不脆弱。 核心前提是,生物细胞本质上是分布式信息处理器,数十亿年前就解决了“幻觉”(噪声)、“无限循环”(癌症)和“资源耗尽”(缺血)等问题。我并不仅仅把这作为一个松散的隐喻,而是使用了应用范畴理论(具体来说是多项式函子)来严格地将基因调控网络映射到软件代理。 库中实现的关键概念: * 代谢共代数:我们将令牌预算建模为热力学资源。这使得代理的“停机问题”可判定,通过强制资源状态严格递减(如ATP耗竭),防止失控循环。 * CFFLs(相干前馈循环):一种用于“二键执行”的拓扑模式,数学上降低了幻觉的概率(假设模型多样性)。 * 伴侣蛋白:部分验证器将模式不匹配视为需要主动修复循环的错误,而不是“未定义”错误。 这是从“提示工程”向“拓扑工程”迈出的早期尝试。 论文(预印本): [https://github.com/coredipper/operon/blob/main/article/main.pdf](https://github.com/coredipper/operon/blob/main/article/main.pdf) 我特别希望得到关于代谢共代数定义的反馈,以及是否有人之前尝试将Poly应用于生产AI系统。