返回首页
一周热榜
大家好,
我正在建立一个名为Persona的平台,旨在将电子邮件调度委托给人工智能。最近,我一直在努力吸引第一批用户,但这确实很具挑战性。
我已经尝试了大家常说的典型策略:冷邮件、LinkedIn InMail、精准定位、写出不错的文案。但结果大多是死胡同,打开率很低,几乎没有回复。
在这个阶段,我并不想听到那些在博客或reddit上常见的建议。我特别想知道那些非常规或不明显的做法,哪些在早期确实对你们有效,尤其是那些当时看起来有点粗糙、奇怪或反直觉的做法。
如果你经历过这个阶段,什么方法真正有效并帮助你获得了第一批用户呢?
嗨,HN,我是Shubham,一名3D艺术家,在大学时学习了编程,作为IT专业毕业生,我了解一些逻辑,但并不是专家,只是想尝试一下人工智能。
我构建了“弹性工作流哨兵”,这是一个离线AI代理,可以根据紧急程度(低、中、高)对任务进行分类,并根据候选人的可用性进行分配。我希望有一个离线系统,让人们可以信任其敏感数据,确保数据完全保留在本地。
我确实使用AI来加速编码和减少人工成本。这个系统运行在RTX 3080的设备上(这是一个基本的、经济实惠的设置,而不是重型AI机器),我希望在不进行重大升级的情况下使其变得可靠。
这个完整的系统不需要Ollama(我并不反对它)。我注意到在公司中,工单通常是在Jira和Slack上提出的。目前,员工或经理(自我管理)必须手动逐一阅读这些工单,或者将它们发送到云端。但问题在于,很多敏感数据无法发送,因为他们不信任云端,这使得手动筛选成千上万的工单变得非常困难。
想象一下,如果你能将所有任务按紧急程度和分配进行分类,你可以有选择性地查看哪些任务是紧急的,需要立即处理,并且所有信息都不会离开你的办公大楼,完全安全。
此外,API发送并不是唯一的问题,你为每个任务支付的代币费用可能每月在100到1000美元之间,这对于初创公司或其他企业来说,可以节省很多麻烦。
在开始时,我尝试了诸如“思维链”、“RISE(先评估负面)”等提示,提供负面和正面示例,但在常识问题上遇到了一些困难(后来我改变了方法)。虽然提示确实给出了输出,并且效果不错,但处理单个任务的时间过长,大约需要70到90秒。
然后我尝试了批处理,但偏差变得更严重,模型总是偏向某些特定的提示,忽略了更多的提示。对于JSON输出,我使用了约束,使模型只能生成JSON,如果失败,还有一个解析器在我实施提示时使用。
这将每个任务的处理时间从90秒减少到大约15到30秒。我使用了引导向量来纠正注意力问题。
技术栈:
- 语言:Python 3.10
- 模型:qwen2.5-7b-instruct
- 库:Pytorch,Hugging Face Transformers(不使用Langchain,不使用Ollama)
- API:Fast API
- 用户界面:NiceGUI
- 硬件:Ryzen 5,16GB RAM,RTX 3080
实施细节:
- 量化:以nf4量化加载模型,使得像7b这样的模型可以适配10GB的显存,这在RTX 3080上也是我的硬件。
- 引导向量:标准提示不足以满足需求。我需要在大型语言模型的某一层阻止或引导某些内容,以提高可靠性。
- JSON约束:使用约束使模型严格输出JSON,并防止过度解释,这发生在logits层面,阻止不必要的token等。
GitHub链接:[https://github.com/resilientworkflowsentinel/resilient-workflow-sentinel](https://github.com/resilientworkflowsentinel/resilient-workflow-sentinel)
YouTube链接:[https://youtu.be/tky3eURLzWo](https://youtu.be/tky3eURLzWo)
嗨,HN,我创建了ec,因为我的一些新手朋友在开发过程中经常遇到Git冲突的问题。
大多数基于终端的合并工具对他们来说使用起来都比较困难或不够直观。他们觉得唯一容易上手的流程是IntelliJ(JetBrains)的冲突解决器,因此我在终端中重现了这种体验。
ec是一个终端原生的三窗格冲突解决器,提供了一个专注的、逐步的流程。如果你尝试使用并给出反馈,我将非常感激。谢谢!
代码库:<a href="https://github.com/chojs23/ec" rel="nofollow">https://github.com/chojs23/ec</a>
嗨,HN,
我正在寻找一款无干扰的写作设备,考虑购买一台超便宜的笔记本电脑,只用来运行vim/nano。
我希望:
- 电池续航优秀
- 键盘手感良好
- 具备睡眠/唤醒功能(为什么在Linux上实现这一点这么困难?)
我在考虑某种类型的Chromebook?或者一台旧的ThinkPad?
我认为代理应该像真正的团队一样运作,具备独立且明确的角色、异步沟通的能力,以及在不重组整个组织的情况下能够引入新队友或工具。我曾在雅虎和抖音构建后端系统,因此事件驱动的代理对我来说显而易见。但当时没有代理SDK采用这种模式,所以我创建了Calfkit。
Calfkit将代理分解为独立的服务(如LLM推理、工具和路由),通过Kafka进行异步通信。代理、工具服务和下游消费者可以独立部署、添加、移除和扩展。
如果你对此感兴趣,可以看看!我很想知道你们的看法。
我的妻子计划开一家微型面包店。我们查看了生产管理软件,但要么价格昂贵,要么过于通用。实际上,小批量生产的工作流程并不复杂,因此我自己开发了一个并将其开源。
Craftplan 处理食谱(版本化的物料清单和成本汇总)、库存(批次追踪、需求预测、过敏原跟踪)、订单、生产批次计划和采购。该软件使用 Elixir、Ash Framework、Phoenix LiveView 和 PostgreSQL 构建。
在线演示: [https://craftplan.fly.dev](https://craftplan.fly.dev) (测试邮箱:test@test.com / 密码:Aa123123123123)
GitHub: [https://github.com/puemos/craftplan](https://github.com/puemos/craftplan)
我是Guy,Snyk的创始人,现在正在构建Tessl,一个用于代理技能的包管理器。
我们最近注意到,大多数团队仍然将技能视为静态的工件:Markdown文件,这些文件是从一个代码库创建或复制到另一个代码库的。
这种方法虽然在初期提供了强劲的推动力,但很快就会造成债务:
- 技能被重复创建,更新从未推送。
- 质量较差的技能被忽视,反而误导了代理而不是帮助他们。
- 技能知识变得陈旧,无法跟上所描述的系统和实践。
如果没有评估技能的方法,团队就无法清楚地了解一个技能的实际质量,或者它是否随着时间的推移而退化。
我们相信,评估是确保技能质量的基础。
考虑到这一点,我很高兴地宣布,Tessl注册中心包含超过2000个技能的评审评估,您可以请求对任何公共技能进行评估。
我对此次发布感到非常兴奋——期待您的反馈,并期待更多的增强功能在排队中!
想收集一些关于因人工智能被解雇的人的故事。不是那种通用的“重组”,也不是新闻稿中所说的,而是因为人工智能的真实原因。有没有相关的证据?
“每个请求的令牌数”在我们的生产环境中一直是一个误导性的成本模型。真正的成本驱动因素似乎是一些乘数:重试/429错误、工具分发、P95上下文增长和安全检查。
在你的生产大语言模型系统中,最大的成本乘数是什么?哪些政策有效(如上限、降级模式、后备方案、硬失败)?