GitHub上最受欢迎的项目是“自己动手做X”(build-your-own-x),目前拥有491K颗星。这是React、Linux或Python的两倍。然而,我几乎从未在HN或其他地方听说过它。即使是关于它的少数HN帖子也显得非常可疑。一个有800分的帖子通常会有超过400条深入的评论,但看看“自己动手做X”的HN提交,它有867分,只有64条评论,几乎没有讨论。
顺便提一下,它是2022年由YC支持的。
返回首页
最新
使用Einlang,您可以编写代码如下:
```plaintext
let x = [
[[1.0, 2.0], [3.0, 4.0]],
[[5.0, 6.0], [7.0, 8.0]]
];
let row_sums[..batch, i] = sum[j](x[..batch, i, j]);
let loss = sum[..batch, i](row_sums[..batch, i] * row_sums[..batch, i]);
let dloss_dx = @loss / @x;
```
Einlang 还支持递归。您可以编写如下代码:
```plaintext
let alpha = 0.25;
let x[0] = 8.0;
let x[k in 1..6] = {
let prev = x[k - 1];
let loss = prev * prev;
let g = @loss / @prev;
prev - alpha * g
};
```
我想要一种方式,能够利用多代理系统的强大功能,处理从架构设计到安全加固的所有事务,而不需要支付“API税”。<p>这就是我构建Gyrus的原因。它是一套开源的自托管代理框架:Frosty用于Snowflake,Zeus用于SQL Server,Mick用于Postgres。其核心理念是完全控制:你自己托管,拥有凭证,并选择模型。
我本周还在更新Snowflake代理,以支持开源的Gemma 4模型。我对其进行了与最先进模型的评估,结果显示在准确性方面表现同样出色。虽然速度稍慢,但它能够免费完成工作。
我还实施了“安全第一”的架构,包括在工具层面硬编码阻止诸如DROP等破坏性命令,因为在数据操作中,仅依靠基于提示的安全措施是不够的。
我复兴了一个旧想法,开发了一个小型的本地 macOS 菜单栏应用,它将你的 tmux 窗口显示为触控条按钮,这样切换窗口只需轻轻一按。<p>它在菜单栏中静静运行,监控当前哪个终端处于焦点(Terminal、iTerm2、Ghostty),并实时更新触控条,显示你当前的 tmux 窗口。<p>这是一个有趣的“随性编码”副项目,同时也是我自己工作流程中想要的实用工具。希望它能对其他人也有所帮助。
嗨,HN,我需要一个分心的事情来逃避这个周末正在进行的令人恐惧的新项目,于是我抓取了HN的样式表,提取了它定义的每种颜色的CSS变量,然后将这些变量重新应用到HN上,使用它自己的选择器(加上一些额外的选择器,用于HN中内联样式的部分,以及在头部和内容样式之间的分隔),使其能够通过变量进行主题化。
在使用这些变量实现暗黑模式(以及适用于OLED的纯黑变体)后,我将所有内容整合到我现有的HN浏览器扩展中,该扩展已经允许你应用自定义CSS,并使其通过<html>上的属性处理主题切换,现在可以使用它来管理自定义样式和主题。上面的友好发布说明中有一些示例,包括截图和可复制的CSS。
如果你只想获取设置CSS变量和应用规则的样式表以便在自己的项目中使用,可以在这里找到[1],但并不是所有内容都可以主题化,稍微需要一些额外的工作——特别是,我不得不将HN的<img src="y18.svg">徽标替换为SVG的内联版本,以便其填充可以通过CSS控制。
[1] <a href="https://github.com/insin/comments-owl-for-hacker-news/blob/master/style.css" rel="nofollow">https://github.com/insin/comments-owl-for-hacker-news/blob/master/style.css</a>
信用使用成本相当隐晦,因此很容易陷入这个陷阱。如果你的信用/代币等用完了,而你需要继续使用Claude/Codex,请不要购买信用,因为这看似值得花钱。它们会在你意识到之前就消耗殆尽。
自托管正在变得越来越流行,因为它允许用户将数据保持私密、本地,并置于自己的环境中。
不幸的是,当有人开始为您的软件付费时,自托管就会出现问题。尤其是当客户是企业客户时。
客户通常并不知道如何操作您的软件。他们可能会更改一些小的设置——如Postgres版本、环境变量、IAM、防火墙规则——然后事情就开始出现故障。从他们的角度来看,产品是坏的。即使根本原因在他们那一边,也无所谓……客户永远是对的,您仍然是被期望去解决问题的人。
但您无法解决。您无法访问他们的环境。您没有真实的可见性。您无法自己运行任何东西。因此,您被困在调试一个您无法控制的系统中,只能通过屏幕截图和在Zoom会议上复制粘贴的日志进行排查。最终,您对一个您无法控制的事情负责。
我认为有一种更好的付费自托管模型:软件在客户的环境中运行,但开发者可以实际操作它。这是双赢的局面:对客户而言,他们的数据保持私密和本地,而开发者仍然可以控制部署、更新和调试。
Alien提供基础设施,以便在用户的环境中部署和操作软件,同时保持对更新、监控和生命周期管理的集中控制。目前支持AWS、GCP和Azure目标。
GitHub: [https://github.com/alienplatform/alien](https://github.com/alienplatform/alien)
入门指南: [https://alien.dev/docs/quickstart](https://alien.dev/docs/quickstart)
工作原理: [https://alien.dev/docs/how-alien-works](https://alien.dev/docs/how-alien-works)
对7年的EIA-930需求数据和每个发布负荷序列的美国平衡机构的ASOS温度进行了精细调整,共涉及三大互联网上的53个机构。在2025年的保留数据(约61,000小时)中,该模型在7个主要区域调度组织(RTO)中有6个超越了运营商提交给EIA的日常预测——即他们用于调度发电的生产预测。宏观平均绝对误差(MAE)降低了约40%。唯一的失利是ISO-NE,其预测能力非常出色(24小时前的均方根误差(MASE)为0.34)。在同一时间窗口内,CAISO和SPP的运营商提交的结果不如“与昨天相同”。
该网站绘制了中位数加上80%的预测区间(PI)带,与运营商提交的结果进行对比,同时展示了48小时的实际数据与预测的关系。
代码和模型在HF上,运营商比较基准从一个脚本中复制:
- [https://github.com/tylergibbs1/surge](https://github.com/tylergibbs1/surge)
- [https://huggingface.co/Tylerbry1/surge-fm-v3](https://huggingface.co/Tylerbry1/surge-fm-v3)
八年前,我和当时的未婚妻决定签署一份婚前协议,因此我们聘请了一位当地的调解员。会议很有帮助,但我觉得没有一个系统的流程来达成最终协议。于是我开始思考这个问题,经过一番研究,我发现了纳什谈判解决方案。
然而,如果约翰·纳什在20世纪50年代就解决了谈判问题,为什么今天似乎没有人使用它呢?问题在于,纳什的解决方案要求谈判的每一方提供一个“效用函数”,这个函数可以将一组交易条款转化为一个效用数值。但即使是专家,在处理非平凡的谈判时也很难提供这样的函数。
几年过去了,语言模型(LLMs)出现了,大约一年前我意识到,虽然LLMs在直接生成效用估计方面表现不佳,但它们在进行比较方面表现出色,这可以用来估算草拟协议的效用。
这就是Mediator.ai的基础,我在周末进行了软启动。通过与LLM进行访谈来捕捉你的偏好,然后邀请其他方也进行同样的操作。这些偏好随后作为遗传算法的适应度函数,用于寻找一个所有方都可能同意的协议。
更多技术细节的文章请见:<a href="https://mediator.ai/blog/ai-negotiation-nash-bargaining/" rel="nofollow">https://mediator.ai/blog/ai-negotiation-nash-bargaining/</a>