1 分•作者: oshadha89•3 个月前•原帖

嗨，HN！我开发了 Tokuin，这是一个 Rust 命令行工具，主要用于 LLM 项目中我一直在拼凑的两个功能： 1. 估算 OpenAI/Gemini/Anthropic 风格模型的提示所需的令牌数和费用。 2. 针对真实的 LLM 端点进行负载测试，支持进度条、重试和（可选的）干运行。最初它只是一个“这个会花费多少令牌？”的脚本。在最近的版本中，我增加了提供者选择功能（--provider {openai|openrouter|anthropic|generic}），以及真实的 Anthropic 客户端和“自带端点”客户端，这样我可以在给它们真实流量之前对网关进行压力测试。试试看： # 安装 ```bash curl -fsSL https://raw.githubusercontent.com/nooscraft/tokuin/main/install.sh | bash ``` # 干运行 Anthropic ```bash echo "Hello!" | tokuin load-test \ --model claude-3-sonnet \ --provider anthropic \ --runs 5 \ --concurrency 2 \ --dry-run --estimate-cost ``` # 通用端点烟雾测试 ```bash echo "Ping" | tokuin load-test \ --model lambda-1 \ --provider generic \ --endpoint https://example.com/infer \ --runs 10 --concurrency 2 ``` 代码库（MIT/Apache-2.0）：[https://github.com/nooscraft/tokuin](https://github.com/nooscraft/tokuin) ### 有什么不同 1. 具备提供者感知的命令行工具：可以根据模型名称自动检测，但在必要时可以强制指定。 2. 内置的 Anthropic 客户端和通用 REST 适配器（只需指向一个端点即可使用）。 3. 可选的 --dry-run 选项可以在不消耗 API 额度的情况下获得相同的指标。 4. 身份验证信息保留在环境变量/标志中，无需配置文件或仪表板。 ### 实现说明 1. 使用 Rust 2021 + tokio、reqwest、indicatif。 2. 负载模拟器调度请求，跟踪延迟、直方图和费用。 3. 令牌估算使用 tiktoken-rs 和一个简单的定价注册表。 ### 我希望得到的反馈 1. 命令行工具的默认设置（超时、重试曲线）对于真实流量是否合理？ 2. 通用模式是否应该接受响应提取钩子，以便与更多 JSON 结构兼容？ 3. 在信任这个工具用于 CI 之前，您希望获得哪些负载测试指标？感谢您尝试这个工具——很高兴回答问题或接受功能请求。

五年后，教堂山实验室面临新的威胁，疫情后的挑战再现。

2 分•作者: sharpshadow•3 个月前•原帖

展示HN：Klotski.org – 一个基于网页的Klotski拼图，包含44个手工制作的关卡

1 分•作者: CoderLim110•3 个月前•原帖

不久前，我的伴侣为我们的孩子买了一台克洛茨基（Klotski）拼图机。令人惊讶的是，它迅速成为了全家人的最爱——从孩子到祖父母，大家都轮流玩这个游戏。不过，这台设备只有10个内置关卡。几天后，我们就把这些关卡都解开了。因此，我决定制作一个自己的网页版，将其扩展到44个独特的布局，并使其在线上对所有人开放。这就是Klotski.org诞生的过程——一个基于浏览器的拼图平台，专注于经典逻辑游戏，以克洛茨基为起点。主要特点： - 44个精心设计的关卡，从初学者友好到极具挑战性。 - 记录你的移动和时间，非常适合自我挑战或友谊竞争。 - 支持桌面和移动设备，无需安装。 - 包括经典的华容道、15拼图和数字克洛茨基变体。 - 通过广告支持平台运营，不会干扰游戏体验。如果你发现某些关卡太难，不用担心——还有一个内置的克洛茨基求解器，可以逐步展示最佳解决方案。不过，我还是建议你先尝试自己解决——当你找到答案的那一刻，才是游戏中最精彩的部分。如何游戏：将红色的曹操方块（2×2）移动到棋盘底部中央的出口（第4-5行，第2-3列）以获胜。我在这里分享这个是因为我希望能得到HN社区的反馈：你认为一个在线拼图平台最重要的是什么——关卡设计、游戏深度还是用户体验？你可以直接在这里玩：<a href="https://klotski.org/" rel="nofollow">https://klotski.org/</a> 试试几个关卡，告诉我哪个让你最困惑，或者你希望看到什么新功能。

展示HN：Oglama – 一款内置大型语言模型（LLM）和可共享模块的自动化浏览器

1 分•作者: markjivko•3 个月前•原帖

经过一年多的开发，我刚刚推出了Oglama，这是一款可以自动化网页任务的桌面应用程序。<p>它就像是增强版的Selenium：<a href="https://oglama.com/vs/selenium/" rel="nofollow">https://oglama.com/vs/selenium/</a>

白天抢劫？伦敦的摩天大楼如何剥夺边缘化群体的阳光

1 分•作者: zeristor•3 个月前•原帖

尝试：对每个项目实验进行模糊匹配目录

1 分•作者: transpute•3 个月前•原帖

传统的指甲花艺术形式正以一种生动的新方式作为表达手段焕发新生。

1 分•作者: binning•3 个月前•原帖

IDC全球人工智能和生成性人工智能支出 – 行业展望

1 分•作者: jruohonen•3 个月前•原帖

Salesforce（Agentforce）宣布达成收购Spindle AI的协议。

1 分•作者: crsn•3 个月前•原帖

一位中世纪牛津修士如何利用光线来探究行星的成分

2 分•作者: zeristor•3 个月前•原帖

大型语言模型如何阅读文档

1 分•作者: makosst•3 个月前•原帖

Sourcekit-Bazel-bsp：在 Cursor / VSCode 中进行 iOS 开发，适用于 Bazel 项目

1 分•作者: rockbruno•3 个月前•原帖

流氓无产阶级

1 分•作者: dsego•3 个月前•原帖

ArahiAI – 一个无代码平台，用于构建能够执行实际操作的人工智能代理。

2 分•作者: innovalabs•3 个月前•原帖

大家好，经过大约十年的软件公司运营，我决定打造自己的产品——Arahi。这是一款无代码平台，任何人都可以创建和部署处理实际工作的代理，这些工作包括研究、内容生成、搜索引擎优化、潜在客户管理和报告。这些代理可以通过内置集成与超过2800种不同的应用程序连接，从而采取行动。我创建这个平台是为了让小团队和独立创始人更容易实现自动化，因为他们没有时间或技术条件手动将所有内容连接在一起。我非常希望能听到你们的反馈： - 什么样的代理或工作流程会真正有用 - 界面和构建体验如何改进 - 这是否能融入你们现有的工作流程你可以在这里试用： https://arahi.ai 欢迎在评论中提出任何技术或产品相关的问题。

让计算机承担责任比让人类承担责任要容易得多。

1 分•作者: NavinF•3 个月前•原帖

谷歌威胁情报组 AI 威胁追踪器：威胁行为者在 AI 工具使用方面的进展

1 分•作者: RA2lover•3 个月前•原帖

机器人群体即将到来

1 分•作者: pretext•3 个月前•原帖

在中国乘坐机器人出租车的体验相当顺畅——这对Waymo来说是个问题。

2 分•作者: pretext•3 个月前•原帖

防止YouTube自动翻译的网页浏览器插件

1 分•作者: faust201•3 个月前•原帖

美国出口促进行政命令“人工智能技术栈”

1 分•作者: walterbell•3 个月前•原帖

上一页 1...1360 1361 1362 1363 1364...4749 下一页

最新