返回首页

一周热榜

2作者: aschuth6 天前原帖
有时间的Molty可以利用起来吗?让他们去工作吧。如果你有一个任务堆积如山的Molty,允许他们进行委派。 Pinchwork是一个市场,代理可以在这里发布任务、接取工作并赚取积分。匹配和验证也由代理完成,整个过程都是递归的劳动。 为什么呢?每个代理都有互联网连接,但并不是每个代理都有所有资源。你缺少Twilio密钥,但一个通知代理却有。你需要生成一张图片,但只能处理文本。你无法审核自己的代码。你是单线程的,但需要同时完成10件事情。 ``` POST /v1/register → 100个免费积分 POST /v1/tasks → 发布带赏金的工作 POST /v1/tasks/pickup → 接取一个任务 POST /v1/tasks/{id}/deliver → 获取报酬 ``` 积分是托管的,交付由独立代理进行验证,整个系统支持JSON或Markdown格式。 支持自托管:docker run。 访问 <a href="https://pinchwork.dev" rel="nofollow">https://pinchwork.dev</a> — 文档请见 <a href="https://pinchwork.dev/skill.md" rel="nofollow">https://pinchwork.dev/skill.md</a>。
2作者: prabhavsanga2 天前原帖
嗨,HN!我开发了 LayerClaw(https://github.com/layerclaw/layerclaw),这是一个以本地为中心的 PyTorch 训练可观察性工具。 问题:在训练神经网络时,很多问题都是悄无声息地发生的。你的损失在第 47,392 步时爆炸;你的梯度在第 12 层消失;你的 GPU 内存随机飙升。等你注意到这些问题时,可能已经浪费了数小时或数天的计算资源。 我厌倦了添加打印语句、手动检查 TensorBoard 文件以及事后追踪训练问题。现有的工具要么需要云账户(如 W&B、Neptune),要么对于快速实验来说太过笨重(如 MLflow、用于梯度分析的 TensorBoard)。 LayerClaw 的功能: - 在训练过程中自动跟踪梯度、指标和系统资源 - 所有数据都存储在本地(使用 SQLite + Parquet,无需云服务) - 检测异常:梯度爆炸、NaN/Inf 值、损失峰值 - 提供命令行界面(CLI)以比较运行结果:`tracer compare run1 run2 --metric loss` - 异步写入的开销极小(约 2-3%) 快速示例: ```python import tracer import torch # 初始化(只需一行) tracer.init(project="my-project", track_gradients=True) # 你的正常训练循环 model = YourModel() tracer._state.tracer.attach_hooks(model) for batch in dataloader: loss = train_step(model, batch) tracer.log({"loss": loss.item()}) tracer.step() tracer.finish() ``` 然后分析:`tracer anomalies my-run --auto` 与其他工具的不同之处: 1. 本地优先:无需注册,无数据离开你的机器,无供应商锁定 2. 专为调试设计:内置深度梯度跟踪和异常检测(不是事后添加的功能) 3. 轻量级:在你的训练循环中只需添加两行代码,开销极小 4. 兼容所有框架:原生 PyTorch、HuggingFace Transformers、PyTorch Lightning 当前限制(v0.1.0): - 仅支持 CLI(计划在 v0.2 中推出 Web UI) - 单机训练(分布式支持即将推出) - 处于早期阶段,欢迎对最有用的功能提供反馈 现在可用: - GitHub: https://github.com/layerclaw/layerclaw *我在寻找贡献者!* 我已经创建了几个“适合新手的问题”,欢迎任何有兴趣贡献的人。需要帮助的领域: - 可视化的 Web UI - 分布式训练支持 - 更多框架集成 - 实时监控仪表板 如果你之前在机器学习训练中遇到过问题,我非常希望听到你认为最有价值的意见。欢迎提交 PR,或者如果你觉得这个项目有趣,请给仓库加星! 什么功能会让这个工具成为你工作流程中不可或缺的一部分?
2作者: tinuviel4 天前原帖
在阅读了Sparkbox上的《在Helene期间,我只想要一个纯文本网站》(<a href="https://news.ycombinator.com/item?id=46494734">https://news.ycombinator.com/item?id=46494734</a>)后,我建立了safe-now.live——一个面向美国和加拿大的文本优先紧急信息网站。没有JavaScript,没有图片,大小不到10KB。该网站实时获取FEMA灾害、NWS警报、天气和当地资源。这是我第一次上线的网站,因此希望能得到大家对网站的反馈。欢迎随意浏览。<p><a href="https://safe-now.live" rel="nofollow">https://safe-now.live</a>
2作者: kaave4 天前原帖
好的,这对你们中的许多人来说可能不算什么大事,但今天我只是感到无聊,对做任何营销都感到疲惫,因为似乎没有什么有效。所以我决定进行一些搜索(我搜索了不少关键词),比如“Supabase的错误跟踪”、“Next.js的错误跟踪”,但我的SaaS并没有排名(如果你不知道我在做什么,我正在开发一个非常简单的错误跟踪工具,当生产环境出现问题时会通知你,没有繁琐的仪表盘或配置地狱)。我之所以开发这个,是因为Sentry的噪音太多,我只想要一个能让我知道生产环境中出现问题的工具。 于是我决定搜索“Shipfast的错误跟踪(由Marc Lou提供)”,结果你猜怎么着?Bugmail是第一个推荐结果。我不知道这是怎么做到的,我做过一些SEO相关的工作,但没想到会有这样的结果,现在我感觉自己回来了,这很有趣,因为我并没有成交,也没有 onboard 新用户,但我感觉自己好像征服了一切,这就是创始人的生活吧。 我只是想在这里分享一下,如果你有任何关于如何在GSC上排名更高以及如何做好营销的建议,任何反馈都会很有价值。 同时,如果你想查看我开发的工具,可以在这里访问:https://www.bugmail.site
2作者: emmasuntech4 天前原帖
我一直在使用可寻址的LED灯带(5V、12V、24V)进行安装。相同的几种故障模式反复出现:长距离运行时出现暗尾、随机闪烁或闪烁,以及连接器成为薄弱环节。 以下是一些对我帮助最大的做法: 将电源分配视为首要设计任务:尽早规划注入点,保持供电线短,并避免将所有电流都通过一端。 始终在控制器和灯带之间共享一个稳定的地线,并保持数据传输路径简单。当线路变长或环境噪声增大时,在数据源附近添加一个小的串联电阻和适当的电平转换(3.3V到5V)通常可以提高稳定性。 假设连接器是“消耗品”:应考虑应力缓解,防水处理需要保持可维护性,高电流线路应选择更保守的方案。 我很好奇你们在注入间距、分支熔断和故障排除方面最可靠的经验法则是什么。如果你有值得信赖的检查清单或测量方法,我很想学习。
2作者: ahacop4 天前原帖
Erwin Brandstetter是一位PostgreSQL顾问,在Stack Overflow上拥有约67万的声誉和约7000个回答。<p>多年来,我已经记不清自己在Stack Overflow上搜索Postgres问题时,有多少次最终找到的答案都是Erwin Brandstetter提供的,这些答案异常详尽且清晰。通过学习他的回答,我成为了一个更优秀的开发者。<p>ErwinDB让你可以离线浏览Erwin Brandstetter的回答,并通过文本用户界面(TUI)快速搜索。它包括语义搜索、语法高亮、单键在外部浏览器中打开链接,以及一个“Erwin模式”,该模式会突出显示他的帖子。
2作者: whispem4 天前原帖
嗨,HN, 我是Emilie,我有文学背景(这也解释了文档写得很好!),在过去几个月里,我通过构建minikv来学习Rust和分布式系统。最近,这个项目在《Programmez!》杂志上被报道了:<a href="https://www.programmez.com/actualites/minikv-un-key-value-store-distribue-en-rust-construit-en-public-38861" rel="nofollow">https://www.programmez.com/actualites/minikv-un-key-value-st...</a> minikv是一个开源的分布式存储引擎,旨在用于学习、实验和自托管设置。它结合了一个强一致性的键值数据库(Raft)、兼容S3的对象存储以及基本的多租户功能。 功能/亮点: - Raft共识,带有自动故障转移和分片 - 兼容S3的HTTP API(以及REST/gRPC API) - 可插拔的存储后端:内存、RocksDB、Sled - 多租户:每个租户的命名空间、基于角色的访问控制、配额和审计 - 指标(Prometheus)、TLS、基于JWT的API密钥 - 易于部署(单个二进制文件,支持Docker/Kubernetes) 快速演示(单节点): ```bash git clone <a href="https://github.com/whispem/minikv.git" rel="nofollow">https://github.com/whispem/minikv.git</a> cd minikv cargo run --release -- --config config.example.toml curl localhost:8080/health/ready ``` # S3上传 + 读取 ```bash curl -X PUT localhost:8080/s3/mybucket/hello -d "hi HN" curl localhost:8080/s3/mybucket/hello ``` 文档、集群设置和架构细节都在代码库中。期待听到大家的反馈、问题、想法,或者你们在Rust中运行分布式基础设施的故事! 代码库:<a href="https://github.com/whispem/minikv" rel="nofollow">https://github.com/whispem/minikv</a> 库:<a href="https://crates.io/crates/minikv" rel="nofollow">https://crates.io/crates/minikv</a>
2作者: debba4 天前原帖
我正在构建 Tabularis,一个原生数据库客户端(Rust + Tauri)。 MySQL 的支持已经相当不错,但 PostgreSQL 的实现要困难得多——这并不是因为性能问题,而是因为 <i>自省</i>。 Postgres “可以工作”,但一旦超出基本的表和列,事情就会迅速变得复杂。 到目前为止,我遇到的一些问题包括: - 类型系统: 数组、JSON/JSONB、域、自定义类型、范围、几何类型——大多数客户端要么将它们扁平化为文本,要么处理不一致。 - 模式自省: information_schema 的功能有限。 pg_catalog 功能强大但微妙。 触发器、函数、分区表、继承、物化视图都需要特殊处理。 - PostgreSQL 特有的用户体验: CTE 重的查询、EXPLAIN ANALYZE 输出、PostGIS / pgvector 等扩展——这些无法干净地映射到通用的数据库抽象。 我目前使用 SQLx 和信息模式 + pg_catalog 查询的组合,但我相信还有更好的模式我尚未发现。 我希望能得到以下人的反馈: - 编写过复杂 PostgreSQL 自省查询的人 - 对 PostgreSQL 客户端应该如何表示模式和类型有看法的人 - 对现有 PostgreSQL 图形用户界面感到沮丧的人 代码库(Apache 2.0):https://github.com/debba/tabularis 我乐于学习、迭代,并修正错误的假设。