1作者: radoslaw-sz11 天前原帖
我一直在开发Maia,这是一个专为多AI代理系统设计的开源测试框架。随着AI部署变得越来越复杂和互联,传统的测试方法在处理代理交互、涌现行为和系统整体可靠性时往往显得力不从心。 Maia通过以下方式解决了这些问题: - 多代理交互测试 - 代理会话中的行为验证 - 消息断言 - 外部工具测试 - 可视化和调试的仪表板 该框架旨在在问题进入生产环境之前捕捉到它们——例如代理协调失败、意外的涌现行为或仅在多个AI组件交互时出现的性能瓶颈。 我非常希望能得到HN社区的反馈,特别是来自那些在生产AI系统中面临类似挑战的朋友们。 GitHub链接: [https://github.com/radoslaw-sz/maia](https://github.com/radoslaw-sz/maia)
2作者: lh_mouse11 天前原帖
系统信息 * CPU: 11代英特尔酷睿i7-1165G7 * 系统: Linux Mint 22.2 * 内核: 6.11.0-1014-lowlatency(无ntsync) * 系统libc: GNU C库 2.39 * Wine: 9.0 * 编译器: GCC 13(均可) 配置和执行时间(时间越短越好) * linux std: (8.150秒) std::mutex,基于pthread * linux boost: (10.936秒) boost::mutex * win std: (20.246秒) std::mutex,基于CRITICAL_SECTION * win boost: (4.849秒) boost::mutex * win srw: (15.853秒) SRWLOCK * win mcf0i: (4.117秒) 来自mcfgthread的_MCF_mutex,内联禁用 该测试使用的代码来自 https://github.com/markwaterman/MutexShootout Hyperfine 截图: https://files.lhmouse.com/20250826-155709.png 当boost::mutex本地编译时,其速度比glibc慢,但当它为Windows编译并在Wine中运行时,其性能超过了除mcfgthread之外的所有选项,包括本地的glibc互斥锁。这是否意味着glibc互斥锁在设计上较差,还是Wine中的线程调度有某种魔力,使得boost::mutex在此测试中表现更佳?
3作者: fzeindl11 天前原帖
我尽量不做悲观者,但现代软件开发到底出了什么问题,为什么需要这么多开发人员,而项目交付却越来越晚?<p>几年前,Dynatrace在全球招聘了一千名开发人员来改进他们的产品。<p>开发整个操作系统及其工具的OSX团队,著名地只有100名开发人员。<p>这个行业到底出了什么问题?是敏捷开发和拉动式开发的原因吗?在使用工单系统之前,情况是怎样的?老板只是把任务分配给员工吗?
1作者: mddanishyusuf11 天前原帖
上周我购买了我的第二个在线业务,一个名为 SuperDev Pro 的 Chrome 扩展程序。它基本上是为开发者和设计师提供的一系列小工具(CSS 检查器、字体检测、颜色选择器等)。 我想分享一下第一周的情况,因为我发现其他人分享数据时,这些帖子总是很有用。 7天统计数据: - 收入:4300美元 - 访客数:7680 - 销售终身许可证超过150个 - 安装量:500 - 域名评分提升了8(现在为15) - 在本周的 Peerlist 上排名第一 我实际做了什么: - 重新设计了网站(之前的设计相当粗糙) - 修复了一些明显的 SEO 问题 - 在 Peerlist 和 Reddit 上发布了信息,带来了流量提升 早期收获: - 如果分发渠道正确,小规模收购可以迅速获得关注 - 设计和 SEO 的调整效果超出了我的预期 - 购买是简单的部分,如何保持增长才是困难的部分 好奇这里是否还有其他人购买过小型软件产品——你们的第一周或第一月是什么样的?