返回首页
一周热榜
有时间的Molty可以利用起来吗?让他们去工作吧。如果你有一个任务堆积如山的Molty,允许他们进行委派。
Pinchwork是一个市场,代理可以在这里发布任务、接取工作并赚取积分。匹配和验证也由代理完成,整个过程都是递归的劳动。
为什么呢?每个代理都有互联网连接,但并不是每个代理都有所有资源。你缺少Twilio密钥,但一个通知代理却有。你需要生成一张图片,但只能处理文本。你无法审核自己的代码。你是单线程的,但需要同时完成10件事情。
```
POST /v1/register → 100个免费积分
POST /v1/tasks → 发布带赏金的工作
POST /v1/tasks/pickup → 接取一个任务
POST /v1/tasks/{id}/deliver → 获取报酬
```
积分是托管的,交付由独立代理进行验证,整个系统支持JSON或Markdown格式。
支持自托管:docker run。
访问 <a href="https://pinchwork.dev" rel="nofollow">https://pinchwork.dev</a> — 文档请见 <a href="https://pinchwork.dev/skill.md" rel="nofollow">https://pinchwork.dev/skill.md</a>。
嗨,HN!我开发了 LayerClaw(https://github.com/layerclaw/layerclaw),这是一个以本地为中心的 PyTorch 训练可观察性工具。
问题:在训练神经网络时,很多问题都是悄无声息地发生的。你的损失在第 47,392 步时爆炸;你的梯度在第 12 层消失;你的 GPU 内存随机飙升。等你注意到这些问题时,可能已经浪费了数小时或数天的计算资源。
我厌倦了添加打印语句、手动检查 TensorBoard 文件以及事后追踪训练问题。现有的工具要么需要云账户(如 W&B、Neptune),要么对于快速实验来说太过笨重(如 MLflow、用于梯度分析的 TensorBoard)。
LayerClaw 的功能:
- 在训练过程中自动跟踪梯度、指标和系统资源
- 所有数据都存储在本地(使用 SQLite + Parquet,无需云服务)
- 检测异常:梯度爆炸、NaN/Inf 值、损失峰值
- 提供命令行界面(CLI)以比较运行结果:`tracer compare run1 run2 --metric loss`
- 异步写入的开销极小(约 2-3%)
快速示例:
```python
import tracer
import torch
# 初始化(只需一行)
tracer.init(project="my-project", track_gradients=True)
# 你的正常训练循环
model = YourModel()
tracer._state.tracer.attach_hooks(model)
for batch in dataloader:
loss = train_step(model, batch)
tracer.log({"loss": loss.item()})
tracer.step()
tracer.finish()
```
然后分析:`tracer anomalies my-run --auto`
与其他工具的不同之处:
1. 本地优先:无需注册,无数据离开你的机器,无供应商锁定
2. 专为调试设计:内置深度梯度跟踪和异常检测(不是事后添加的功能)
3. 轻量级:在你的训练循环中只需添加两行代码,开销极小
4. 兼容所有框架:原生 PyTorch、HuggingFace Transformers、PyTorch Lightning
当前限制(v0.1.0):
- 仅支持 CLI(计划在 v0.2 中推出 Web UI)
- 单机训练(分布式支持即将推出)
- 处于早期阶段,欢迎对最有用的功能提供反馈
现在可用:
- GitHub: https://github.com/layerclaw/layerclaw
*我在寻找贡献者!* 我已经创建了几个“适合新手的问题”,欢迎任何有兴趣贡献的人。需要帮助的领域:
- 可视化的 Web UI
- 分布式训练支持
- 更多框架集成
- 实时监控仪表板
如果你之前在机器学习训练中遇到过问题,我非常希望听到你认为最有价值的意见。欢迎提交 PR,或者如果你觉得这个项目有趣,请给仓库加星!
什么功能会让这个工具成为你工作流程中不可或缺的一部分?
在阅读了Sparkbox上的《在Helene期间,我只想要一个纯文本网站》(<a href="https://news.ycombinator.com/item?id=46494734">https://news.ycombinator.com/item?id=46494734</a>)后,我建立了safe-now.live——一个面向美国和加拿大的文本优先紧急信息网站。没有JavaScript,没有图片,大小不到10KB。该网站实时获取FEMA灾害、NWS警报、天气和当地资源。这是我第一次上线的网站,因此希望能得到大家对网站的反馈。欢迎随意浏览。<p><a href="https://safe-now.live" rel="nofollow">https://safe-now.live</a>
好的,这对你们中的许多人来说可能不算什么大事,但今天我只是感到无聊,对做任何营销都感到疲惫,因为似乎没有什么有效。所以我决定进行一些搜索(我搜索了不少关键词),比如“Supabase的错误跟踪”、“Next.js的错误跟踪”,但我的SaaS并没有排名(如果你不知道我在做什么,我正在开发一个非常简单的错误跟踪工具,当生产环境出现问题时会通知你,没有繁琐的仪表盘或配置地狱)。我之所以开发这个,是因为Sentry的噪音太多,我只想要一个能让我知道生产环境中出现问题的工具。
于是我决定搜索“Shipfast的错误跟踪(由Marc Lou提供)”,结果你猜怎么着?Bugmail是第一个推荐结果。我不知道这是怎么做到的,我做过一些SEO相关的工作,但没想到会有这样的结果,现在我感觉自己回来了,这很有趣,因为我并没有成交,也没有 onboard 新用户,但我感觉自己好像征服了一切,这就是创始人的生活吧。
我只是想在这里分享一下,如果你有任何关于如何在GSC上排名更高以及如何做好营销的建议,任何反馈都会很有价值。
同时,如果你想查看我开发的工具,可以在这里访问:https://www.bugmail.site
我一直在使用可寻址的LED灯带(5V、12V、24V)进行安装。相同的几种故障模式反复出现:长距离运行时出现暗尾、随机闪烁或闪烁,以及连接器成为薄弱环节。
以下是一些对我帮助最大的做法:
将电源分配视为首要设计任务:尽早规划注入点,保持供电线短,并避免将所有电流都通过一端。
始终在控制器和灯带之间共享一个稳定的地线,并保持数据传输路径简单。当线路变长或环境噪声增大时,在数据源附近添加一个小的串联电阻和适当的电平转换(3.3V到5V)通常可以提高稳定性。
假设连接器是“消耗品”:应考虑应力缓解,防水处理需要保持可维护性,高电流线路应选择更保守的方案。
我很好奇你们在注入间距、分支熔断和故障排除方面最可靠的经验法则是什么。如果你有值得信赖的检查清单或测量方法,我很想学习。
Erwin Brandstetter是一位PostgreSQL顾问,在Stack Overflow上拥有约67万的声誉和约7000个回答。<p>多年来,我已经记不清自己在Stack Overflow上搜索Postgres问题时,有多少次最终找到的答案都是Erwin Brandstetter提供的,这些答案异常详尽且清晰。通过学习他的回答,我成为了一个更优秀的开发者。<p>ErwinDB让你可以离线浏览Erwin Brandstetter的回答,并通过文本用户界面(TUI)快速搜索。它包括语义搜索、语法高亮、单键在外部浏览器中打开链接,以及一个“Erwin模式”,该模式会突出显示他的帖子。
嗨,HN,
我是Emilie,我有文学背景(这也解释了文档写得很好!),在过去几个月里,我通过构建minikv来学习Rust和分布式系统。最近,这个项目在《Programmez!》杂志上被报道了:<a href="https://www.programmez.com/actualites/minikv-un-key-value-store-distribue-en-rust-construit-en-public-38861" rel="nofollow">https://www.programmez.com/actualites/minikv-un-key-value-st...</a>
minikv是一个开源的分布式存储引擎,旨在用于学习、实验和自托管设置。它结合了一个强一致性的键值数据库(Raft)、兼容S3的对象存储以及基本的多租户功能。
功能/亮点:
- Raft共识,带有自动故障转移和分片
- 兼容S3的HTTP API(以及REST/gRPC API)
- 可插拔的存储后端:内存、RocksDB、Sled
- 多租户:每个租户的命名空间、基于角色的访问控制、配额和审计
- 指标(Prometheus)、TLS、基于JWT的API密钥
- 易于部署(单个二进制文件,支持Docker/Kubernetes)
快速演示(单节点):
```bash
git clone <a href="https://github.com/whispem/minikv.git" rel="nofollow">https://github.com/whispem/minikv.git</a>
cd minikv
cargo run --release -- --config config.example.toml
curl localhost:8080/health/ready
```
# S3上传 + 读取
```bash
curl -X PUT localhost:8080/s3/mybucket/hello -d "hi HN"
curl localhost:8080/s3/mybucket/hello
```
文档、集群设置和架构细节都在代码库中。期待听到大家的反馈、问题、想法,或者你们在Rust中运行分布式基础设施的故事!
代码库:<a href="https://github.com/whispem/minikv" rel="nofollow">https://github.com/whispem/minikv</a>
库:<a href="https://crates.io/crates/minikv" rel="nofollow">https://crates.io/crates/minikv</a>
我正在构建 Tabularis,一个原生数据库客户端(Rust + Tauri)。
MySQL 的支持已经相当不错,但 PostgreSQL 的实现要困难得多——这并不是因为性能问题,而是因为 <i>自省</i>。
Postgres “可以工作”,但一旦超出基本的表和列,事情就会迅速变得复杂。
到目前为止,我遇到的一些问题包括:
- 类型系统:
数组、JSON/JSONB、域、自定义类型、范围、几何类型——大多数客户端要么将它们扁平化为文本,要么处理不一致。
- 模式自省:
information_schema 的功能有限。
pg_catalog 功能强大但微妙。
触发器、函数、分区表、继承、物化视图都需要特殊处理。
- PostgreSQL 特有的用户体验:
CTE 重的查询、EXPLAIN ANALYZE 输出、PostGIS / pgvector 等扩展——这些无法干净地映射到通用的数据库抽象。
我目前使用 SQLx 和信息模式 + pg_catalog 查询的组合,但我相信还有更好的模式我尚未发现。
我希望能得到以下人的反馈:
- 编写过复杂 PostgreSQL 自省查询的人
- 对 PostgreSQL 客户端应该如何表示模式和类型有看法的人
- 对现有 PostgreSQL 图形用户界面感到沮丧的人
代码库(Apache 2.0):https://github.com/debba/tabularis
我乐于学习、迭代,并修正错误的假设。