<a href="https://chengai.me" rel="nofollow">https://chengai.me</a><p>问题:招聘应届毕业生的过程存在问题。成千上万的简历看似相同,但我们每个人都是不同的个体。了解一个人需要时间——评估、电话筛选、多轮面试。大多数人从未被真正看见。<p>我不想成为另一份普通的PDF简历。因此,我构建了一个可以被招聘人员实际面试的AI双胞胎。<p>你可以做的事情:
• 就任何问题面试我的AI:<a href="https://chengai.me/chat" rel="nofollow">https://chengai.me/chat</a>
• 粘贴你的职位描述,看看我们是否匹配:<a href="https://chengai.me/jd-match" rel="nofollow">https://chengai.me/jd-match</a>
• 探索我的项目、代码和写作<p>发生了什么:我把它发给了一位LinkedIn上的招聘人员。第二天,流量激增,因为它在内部传播。24小时内收到了面试邀请。<p>更大的愿景:如果这成为标准怎么办?不再是简历垃圾邮件 → 关键词筛选 → 仍然错过合适人选的面试轮次,而是让招聘AI与候选人AI进行深入交流。建立一个平台,让任何人都可以创建自己的AI双胞胎,实现真正的匹配。<p>我正在寻找软件/人工智能/机器学习工程职位,并能够从零开始构建生产就绪的解决方案。<p>这个网站本身证明了我的能力。非常希望听到HN对执行和愿景的看法。
返回首页
一周热榜
我为智能眼镜开发了一款免提的抬头显示器(HUD),能够运行现实世界的速通计时器,并根据摄像头所见自动进行分段。演示场景:制作寿司。<p>演示视频:<a href="https://www.youtube.com/watch?v=NuOVlyr-e1w" rel="nofollow">https://www.youtube.com/watch?v=NuOVlyr-e1w</a><p>代码库:<a href="https://github.com/RealComputer/GlassKit" rel="nofollow">https://github.com/RealComputer/GlassKit</a><p>我最初尝试使用多模态大语言模型进行场景理解,但由于延迟和一致性不够理想,因此我转向了一个小型物体检测模型(微调的RF-DETR)。该模型仅在摄像头视频流上运行推理循环。这也使得设备本地/离线使用成为可能(目前仍通过本地服务器运行)。
我想给正在研究小型加密交易平台的朋友们发个安全提醒。
如果你遇到CZR交易所,请务必保持高度警惕。在加密货币领域,一个常见的风险并不是“价格风险”,而是权限风险:一旦你将钱包连接到一个未知的去中心化应用(dApp)或将资产发送到一个未验证的地址,你可能无法找回任何东西。
以下是一些适用于此处(以及任何地方)的基本安全步骤:
- 不要将你的钱包连接到无法独立验证的网站。
- 不要仅仅因为某个页面或支持账号告诉你,就向平台发送USDT/BTC。
- 将“即时提现”、“限时验证”或“紧急存款以解锁资金”视为重大警告信号。
- 在测试任何新服务时,使用一个新的钱包/最少的资金,并撤销你不认识的授权。
- 如果有人有可验证的证据(交易哈希、存档页面、签名消息、带时间戳的清晰截图),请分享。如果没有,请保持客观,避免猜测。
嗨,HN,
我们花了一年时间构建AI代理,但一直遇到同样的问题:提示工程(prompt engineering)并不像软件工程那样。它更像是在猜测。
我们创建了OpenSymbolicAI,旨在将代理开发转变为真正的编程。它是一个开源框架(MIT许可证),允许您使用类型化原语、明确的分解和单元测试来构建代理。
主要问题:上下文窗口的滥用
大多数代理框架(如ReAct)迫使您将工具输出重新放入LLM(大型语言模型)的上下文窗口,以决定下一步。
代理搜索数据库。
代理返回50KB的JSON。
您将这50KB的内容粘贴回提示中,只是为了问“我接下来该做什么?”
这既慢又昂贵,还会让模型感到困惑。
解决方案:将数据作为变量
在OpenSymbolicAI中,LLM生成一个操作变量的计划(代码)。实际的重数据(搜索结果、PDF内容、API负载)存储在Python/运行时变量中,直到某个特定原语真正需要读取它时,才会传递给LLM上下文。
可以将其视为代理的引用传递。LLM操作变量句柄(文档),而Python运行时存储实际数据。
示例:RAG代理
与其让LLM基于一堆文本进行幻觉式的计划,不如直接编写逻辑来操作数据容器。
```python
class ResearchAgent(PlanExecute):
@primitive
def retrieve_documents(self, query: str) -> list[Document]:
"""从向量数据库中获取重文档。"""
# 返回保持在Python内存中的重对象
return vector_store.search(query)
@primitive
def synthesize_answer(self, docs: list[Document]) -> str:
"""利用文档生成答案。"""
# 这是唯一一步实际读取文档文本
context = "\n".join([d.text for d in docs])
return llm.generate(context)
@decomposition(intent="Research quantum computing")
def _example_flow(self):
# LLM生成此执行计划。
# 关键是:LLM管理'docs'变量符号,
# 但在规划过程中从未看到其内部的庞大负载。
docs = self.retrieve_documents("当前量子计算的状态")
return self.synthesize_answer(docs)
```
agent = ResearchAgent()
agent.run("研究固态电池的最新进展")
讨论
我们希望听到社区的反馈:
您在提示工程的脆弱性方面遇到了哪些困难?
什么会让您愿意尝试将提示视为代码?
还有哪些领域可以让这种方法大放异彩?
为了使其适用于您的用例,缺少什么才能使其准备好投入生产?
代码故意保持简单的Python,没有魔法,没有框架锁定。如果这种方法引起共鸣,您可以轻松地根据您的具体需求进行调整或与现有代码库集成。
代码库:
核心(Python): [https://github.com/OpenSymbolicAI/core-py](https://github.com/OpenSymbolicAI/core-py)
文档: [https://www.opensymbolic.ai/](https://www.opensymbolic.ai/)
博客(技术深入): [https://www.opensymbolic.ai/blog](https://www.opensymbolic.ai/blog)
特别是对于包含代码的技术书籍
我在 texttospeech.site 上建立了一个简单的文本转语音转换器。
<p>免费版:每天生成10次,标准语音,无需账户。
专业版:Neural2 语音,2000个字符,可下载MP3文件。
<p>技术栈:Next.js、Google Cloud TTS API、Vercel。
<p>这个2美元的域名是一个SEO实验,因为我的 speechtotext.xyz 卫星网站为我的主要产品带来了22%的流量。我很好奇精确匹配的关键词域名是否仍然适用于TTS搜索。
<p>欢迎反馈,特别是在语音质量和用户体验方面。