返回首页

一周热榜

2作者: Charlie1124 天前原帖
<a href="https://chengai.me" rel="nofollow">https://chengai.me</a><p>问题:招聘应届毕业生的过程存在问题。成千上万的简历看似相同,但我们每个人都是不同的个体。了解一个人需要时间——评估、电话筛选、多轮面试。大多数人从未被真正看见。<p>我不想成为另一份普通的PDF简历。因此,我构建了一个可以被招聘人员实际面试的AI双胞胎。<p>你可以做的事情: • 就任何问题面试我的AI:<a href="https://chengai.me/chat" rel="nofollow">https://chengai.me/chat</a> • 粘贴你的职位描述,看看我们是否匹配:<a href="https://chengai.me/jd-match" rel="nofollow">https://chengai.me/jd-match</a> • 探索我的项目、代码和写作<p>发生了什么:我把它发给了一位LinkedIn上的招聘人员。第二天,流量激增,因为它在内部传播。24小时内收到了面试邀请。<p>更大的愿景:如果这成为标准怎么办?不再是简历垃圾邮件 → 关键词筛选 → 仍然错过合适人选的面试轮次,而是让招聘AI与候选人AI进行深入交流。建立一个平台,让任何人都可以创建自己的AI双胞胎,实现真正的匹配。<p>我正在寻找软件/人工智能/机器学习工程职位,并能够从零开始构建生产就绪的解决方案。<p>这个网站本身证明了我的能力。非常希望听到HN对执行和愿景的看法。
2作者: tash_2s4 天前原帖
我为智能眼镜开发了一款免提的抬头显示器(HUD),能够运行现实世界的速通计时器,并根据摄像头所见自动进行分段。演示场景:制作寿司。<p>演示视频:<a href="https://www.youtube.com/watch?v=NuOVlyr-e1w" rel="nofollow">https://www.youtube.com/watch?v=NuOVlyr-e1w</a><p>代码库:<a href="https://github.com/RealComputer/GlassKit" rel="nofollow">https://github.com/RealComputer/GlassKit</a><p>我最初尝试使用多模态大语言模型进行场景理解,但由于延迟和一致性不够理想,因此我转向了一个小型物体检测模型(微调的RF-DETR)。该模型仅在摄像头视频流上运行推理循环。这也使得设备本地/离线使用成为可能(目前仍通过本地服务器运行)。
2作者: Morris_6 天前原帖
我想给正在研究小型加密交易平台的朋友们发个安全提醒。 如果你遇到CZR交易所,请务必保持高度警惕。在加密货币领域,一个常见的风险并不是“价格风险”,而是权限风险:一旦你将钱包连接到一个未知的去中心化应用(dApp)或将资产发送到一个未验证的地址,你可能无法找回任何东西。 以下是一些适用于此处(以及任何地方)的基本安全步骤: - 不要将你的钱包连接到无法独立验证的网站。 - 不要仅仅因为某个页面或支持账号告诉你,就向平台发送USDT/BTC。 - 将“即时提现”、“限时验证”或“紧急存款以解锁资金”视为重大警告信号。 - 在测试任何新服务时,使用一个新的钱包/最少的资金,并撤销你不认识的授权。 - 如果有人有可验证的证据(交易哈希、存档页面、签名消息、带时间戳的清晰截图),请分享。如果没有,请保持客观,避免猜测。
2作者: rksart4 天前原帖
嗨,HN, 我们花了一年时间构建AI代理,但一直遇到同样的问题:提示工程(prompt engineering)并不像软件工程那样。它更像是在猜测。 我们创建了OpenSymbolicAI,旨在将代理开发转变为真正的编程。它是一个开源框架(MIT许可证),允许您使用类型化原语、明确的分解和单元测试来构建代理。 主要问题:上下文窗口的滥用 大多数代理框架(如ReAct)迫使您将工具输出重新放入LLM(大型语言模型)的上下文窗口,以决定下一步。 代理搜索数据库。 代理返回50KB的JSON。 您将这50KB的内容粘贴回提示中,只是为了问“我接下来该做什么?” 这既慢又昂贵,还会让模型感到困惑。 解决方案:将数据作为变量 在OpenSymbolicAI中,LLM生成一个操作变量的计划(代码)。实际的重数据(搜索结果、PDF内容、API负载)存储在Python/运行时变量中,直到某个特定原语真正需要读取它时,才会传递给LLM上下文。 可以将其视为代理的引用传递。LLM操作变量句柄(文档),而Python运行时存储实际数据。 示例:RAG代理 与其让LLM基于一堆文本进行幻觉式的计划,不如直接编写逻辑来操作数据容器。 ```python class ResearchAgent(PlanExecute): @primitive def retrieve_documents(self, query: str) -> list[Document]: """从向量数据库中获取重文档。""" # 返回保持在Python内存中的重对象 return vector_store.search(query) @primitive def synthesize_answer(self, docs: list[Document]) -> str: """利用文档生成答案。""" # 这是唯一一步实际读取文档文本 context = "\n".join([d.text for d in docs]) return llm.generate(context) @decomposition(intent="Research quantum computing") def _example_flow(self): # LLM生成此执行计划。 # 关键是:LLM管理'docs'变量符号, # 但在规划过程中从未看到其内部的庞大负载。 docs = self.retrieve_documents("当前量子计算的状态") return self.synthesize_answer(docs) ``` agent = ResearchAgent() agent.run("研究固态电池的最新进展") 讨论 我们希望听到社区的反馈: 您在提示工程的脆弱性方面遇到了哪些困难? 什么会让您愿意尝试将提示视为代码? 还有哪些领域可以让这种方法大放异彩? 为了使其适用于您的用例,缺少什么才能使其准备好投入生产? 代码故意保持简单的Python,没有魔法,没有框架锁定。如果这种方法引起共鸣,您可以轻松地根据您的具体需求进行调整或与现有代码库集成。 代码库: 核心(Python): [https://github.com/OpenSymbolicAI/core-py](https://github.com/OpenSymbolicAI/core-py) 文档: [https://www.opensymbolic.ai/](https://www.opensymbolic.ai/) 博客(技术深入): [https://www.opensymbolic.ai/blog](https://www.opensymbolic.ai/blog)
2作者: digi_wares7 天前原帖
我在 texttospeech.site 上建立了一个简单的文本转语音转换器。 <p>免费版:每天生成10次,标准语音,无需账户。 专业版:Neural2 语音,2000个字符,可下载MP3文件。 <p>技术栈:Next.js、Google Cloud TTS API、Vercel。 <p>这个2美元的域名是一个SEO实验,因为我的 speechtotext.xyz 卫星网站为我的主要产品带来了22%的流量。我很好奇精确匹配的关键词域名是否仍然适用于TTS搜索。 <p>欢迎反馈,特别是在语音质量和用户体验方面。