16作者: littlexsparkee大约 1 个月前原帖
《华尔街日报》文章(“人工智能黑客正在危险地接近击败人类”):<a href="https://www.wsj.com/tech/ai/ai-hackers-are-coming-dangerously-close-to-beating-humans-4afc3ad6" rel="nofollow">https://www.wsj.com/tech/ai/ai-hackers-are-coming-dangerously-close-to-beating-humans-4afc3ad6</a>,<a href="https://archive.ph/L4gh3" rel="nofollow">https://archive.ph/L4gh3</a>
2作者: thedangler大约 1 个月前原帖
你好, 我已经在一个小众产品的最小可行产品(MVP)上工作了一个多月,我相信它已经准备好进行Beta测试。 在发布之前,有哪些步骤可以帮助我进行一次成功的Beta发布? 以下是我在发布前的清单: 1. 网页展示产品的功能以及解决了什么问题。 2. 加入一个Beta候补名单,加入一个社区,以获得支持、视频和功能请求。 3. 在社交网站的特定社区(如Reddit、Discord)上发布消息。 4. 提供一个合理价格的终身通行证,给予用户一个增强计划。 当前问题: 我不知道如何定价。对于大多数人来说,它将分为三个计划,而特殊情况将有两个额外的计划。 一些功能有实际可测量的成本,例如机器人、短信等。我不确定如何加价。是否应该做成单点购买? 我仍然需要构建iOS和Android应用程序,但在没有真实反馈和API构建之前不会进行。 有什么想法、反馈,如何确定价格,如何进行市场营销而不让人觉得是在营销?有什么不同的准备建议? 感谢你的反馈。
2作者: nsomani大约 1 个月前原帖
嗨,HN,我一直在探索形式方法在机器学习/可解释性方面的各种应用,希望能让更多人关注这种方法。 我正在进行一个小型的可解释性项目,称为符号电路蒸馏。其目标是从一个微小的神经元级电路(比如OpenAI的“稀疏电路”工作中的电路)自动恢复一个简洁的Python程序,该程序实现相同的算法,并提供一个有界的形式证明,证明这两者在有限的标记域上是等价的。 大致的流程如下: 1. 从一个针对特定行为(例如,引用闭合或括号深度)提取的修剪电路图开始,该电路图来自一个变换器。 2. 将电路视为可执行函数,并训练一个小型的ReLU网络(“替代网络”),使其在有界域内的所有输入上与电路完全匹配(通常是长度为5-10的序列,使用小型标记字母表)。 3. 在常见变换器模式(计数器、开关、阈值检测器、小型状态机)的受限领域特定语言(DSL)中搜索,以合成候选的Python程序。 4. 使用基于SMT的有界等价性检查,来: - 证明候选程序和替代网络在该域的所有输入上是一致的,或者 - 生成一个反例输入,排除该程序。 如果求解器找到证明,你将获得一个小型、可读的Python函数,以及一个机器可检查的保证,证明它在该有界域上与原始电路匹配。 我为什么要构建这个项目 机械可解释性在从大型模型中提取“简洁小电路”方面已经相当成熟,但将这些图转换为干净、可读的算法仍然非常手动。我的目标是自动化最后一步:从“这是一个稀疏电路”到“这是一个经过验证的算法,解释它的功能”,而无需手动干预。 目前的工作进展 - 任务:来自OpenAI circuit_sparsity库的引用闭合和括号深度检测。 - 在有限标记域上的精确替代拟合。 - 简单计数器、开关和小型状态机的DSL模板。 - 基于SMT的有界等价性检查: 稀疏电路 -> ReLU替代网络 -> DSL中的Python程序。 局限性和待解决的问题 - 保证是有界的:等价性仅在有限标记域(短序列和小词汇表)上得到证明。 - 目前专注于非常小的电路。扩展到更大电路和更长上下文仍需工程和研究工作。 - DSL是围绕几个模式手动设计的。我尚未学习DSL本身或在搜索中做任何非常巧妙的事情。 我希望获得的反馈 - 问题框架和保证对从事机械可解释性或形式方法的人是否有趣? - 对下一个基准的建议:你希望看到哪些电路或行为被蒸馏? - 对DSL设计、搜索策略和SMT设置的反馈。 欢迎对实施细节、SMT编码、与OpenAI的稀疏电路库的集成或其他任何问题进行提问。