5作者: kaifahmad1大约 1 个月前原帖
嗨,HN, 我想分享一下Semantica,这是一个获得麻省理工学院许可的开源框架,用于构建语义层和知识工程系统,以支持人工智能。 许多RAG(检索增强生成)和代理系统的失败并非由于模型质量,而是由于语义鸿沟——即缺乏明确实体、规则或关系的非结构化、不一致的数据。仅依赖向量的方法在处理真实世界数据时,往往会出现幻觉或默默失败。 Semantica专注于将杂乱的数据转化为适合推理的语义知识。 核心功能: - 通用数据摄取(PDF、DOCX、HTML、JSON、CSV、数据库、API) - 自动实体和关系提取 - 知识图谱构建与实体解析 - 自动本体生成与验证 - GraphRAG(混合向量 + 图检索,多跳推理) - 持久的语义记忆用于AI代理 - 冲突检测、去重和来源追踪 项目链接: 文档:https://hawksight-ai.github.io/semantica/ GitHub:https://github.com/Hawksight-AI/semantica 我非常希望能收到从事知识图谱、GraphRAG、代理记忆或生产RAG可靠性方面的人的反馈。 欢迎讨论设计权衡或回答技术问题。
1作者: mambazz大约 1 个月前原帖
我对现有的“免费短信”网站感到非常失望。大多数网站充斥着恼人的广告,而且一半的号码通常都是无效的或被主要服务商列入黑名单。<p>为了自己解决这个问题,我创建了<a href="https://smsreceive.live" rel="nofollow">https://smsreceive.live</a>。该网站专注于简洁的用户界面,我每天努力更新新的号码,以确保它们确实可以用于一次性密码(OTP)验证。<p>我还在<a href="https://receivesms.me" rel="nofollow">https://receivesms.me</a>上镜像了这个项目,以测试不同的缓存策略并确保高可用性。<p>非常希望听到你对用户界面/用户体验的看法,或者任何关于如何改进号码轮换逻辑的建议。
1作者: AryanKumar1401大约 1 个月前原帖
我构建了一个命令行工具,用于在代码发布到生产环境之前捕捉慢速导入和潜在的副作用。 问题:Python 导入可能会悄然成为性能陷阱。你的命令行工具在显示 --help 时需要 2 秒,因为导入你的包时拉入了 pandas。更糟糕的是,导入某个模块可能会导致网络调用或写入文件等副作用。 Importguard 利用 Python 的 -X importtime 标志精确测量每个导入所需的时间,然后让你可以: - 设置时间预算:`importguard check mypkg --max-ms 200` - 禁止重型导入:`importguard check mypkg.cli --ban pandas --ban torch` - 获取可靠的计时:`--repeat 5` 多次运行并报告中位数 - 在 `.importguard.toml` 中配置每个模块的规则 它在一个独立的子进程中运行,因此不会污染你的解释器,并输出 JSON 以便进行 CI 集成。 使用场景: - 保持命令行工具启动迅速 - 防止无服务器冷启动回归(Lambda/Cloud Functions) - 确保库的卫生(不强迫用户安装重型依赖) 使用命令:`pip install importguardpy` GitHub: [https://github.com/AryanKumar1401/importguard](https://github.com/AryanKumar1401/importguard) 欢迎反馈如何使这个工具更有用!