返回首页
一周热榜
我在OpenAI的应用程序SDK的海洋中游泳……并带回了一本手册!<p>在过去的几周里,我深入研究了ChatGPT应用程序SDK:探索其API、工具和隐藏的宝藏。在这个过程中,我构建、破坏、修复并重新构思了一些小实验。<p>附言:确实,OpenAI的官方文档是权威来源,这只是一本粗略的笔记本。<p>也许,我可以创建一个命令行工具来搭建应用程序的框架?
构建了一个基于Lua的原生Scratch 3.0运行时,可以在不使用浏览器的情况下运行.sb3项目。
<p>为什么要这样做?浏览器的沙盒限制阻止了对硬件功能(如触觉反馈、传感器、精细性能控制)的访问。原生运行时可以直接访问硬件,并允许你部署到游戏主机、手持设备和嵌入式设备。此外,这也意味着生成的二进制文件要小得多(LÖVE约为7MB,而Electron则为50-100MB)。
<p>它是如何工作的:
<p>- Scratch模块编译为中间表示(IR),然后进行优化,最后生成Lua代码。
<p>- LuaJIT执行编译后的代码。
<p>- 基于协程的线程处理以支持并发脚本。
<p>- 懒加载和LRU缓存用于内存管理。
<p>- 通过resvg FFI支持SVG。
<p>与Scratch 3.0模块大约有100%的兼容性。需要JavaScript的扩展(如音乐、文本转语音、视频感应)将无法使用,但核心模块是可用的。
<p>基于LÖVE框架构建,因此它是跨平台的(桌面、移动、游戏设备)。
<p>虽然仍有一些不完善之处(用户输入尚未实现,云变量仅在本地工作),但它今天可以运行真实的Scratch项目。
我正在开发一个名为 Trash Panda 的浏览器扩展,它可以移除“社交指标”:点赞数、订阅者数、关注者数、星标、收藏、赞成票、反对票等。
在开发这个扩展时,我心中有几个主要网站的目标,但我惊讶地发现这些社交指标在整个网络上是如此普遍。当扩展移除这些指标后,网页感觉更加宁静。
该扩展提供 30 天的免费试用。
请告诉我你的想法——目前仍处于早期阶段!
嘿,HN,
我很高兴地分享《大规模法律嵌入基准》(Massive Legal Embedding Benchmark,简称MLEB)——这是第一个全面的法律嵌入模型基准。
与以往的法律检索数据集不同,MLEB是由具有实际领域专业知识的人创建的(我拥有法律学位,并曾在澳大利亚总检察长办公室领导人工智能团队)。
我在尝试训练自己的最先进法律嵌入模型时想到了MLEB。我发现没有合适的法律信息检索基准来评估我的模型。
这促使我和我的兄弟花了几个月的时间来识别或在许多情况下构建我们自己的高质量法律评估集。
最终产品是10个数据集,涵盖多个法域(美国、英国、澳大利亚、新加坡和爱尔兰)、文档类型(案例、法律、法规、合同和教科书)以及问题类型(检索、零样本分类和问答),所有数据集都经过质量、多样性和实用性的审核。
为了在MLEB上表现良好,模型需要具备广泛的法律领域知识和强大的法律推理能力。这是有意为之——考虑到高质量嵌入对法律RAG(特别是在减少幻觉方面)的重要性,我们希望我们的基准尽可能与现实世界的实用性相关联。
我们最自豪的数据集名为《澳大利亚税务指导检索》。它将澳大利亚纳税人提出的真实税务问题与相关的澳大利亚政府指导和政策文件配对。
我们通过从澳大利亚税务局的社区论坛中获取问题来构建该数据集,论坛中,澳大利亚纳税人向会计师和ATO官员询问他们的税务问题。
我们发现,在大多数情况下,这些问题可以通过参考政府网页来回答,而用户出于某种原因未能找到这些网页。因此,我们手动筛选了112个具有挑战性的论坛问题,并提取了税务专家确认的相关政府指导材料的相关部分。
该数据集之所以如此有价值,是因为与目前可用的大多数法律信息检索评估集不同,它由真正具有挑战性的真实用户创建的问题组成,而不是有时与嵌入模型实际使用的任务类型相差甚远的人工构造查询。
《澳大利亚税务指导检索》只是我们辛苦构建的几个评估集之一,因为当时没有其他选择。
我们将所有内容,包括用于在MLEB上评估模型的代码,贡献回开源社区。
我们的希望是,MLEB及其内部的数据集能够在未来长期保持价值,以便其他训练法律信息检索模型的人不必绕道去构建自己的“法律MTEB”。
如果您想直接查看排行榜,而不是阅读我们的完整公告,可以在这里找到: [https://isaacus.com/mleb](https://isaacus.com/mleb)
如果您有兴趣尝试我们的模型,截止到2025年10月16日,它在MLEB上排名第一,请查看我们的文档: [https://docs.isaacus.com/quickstart](https://docs.isaacus.com/quickstart)
来自LinkedIn:<p><i>数据中心无法获得电网电力长达7年。<p>因此,他们将旧的747发动机固定在混凝土上。<p>这不是创新,而是基础设施的失败。<p>ProEnergy已经出售了21台改装的喷气发动机来为数据中心供电,每台功率为48兆瓦。这些是CF6-80C2核心,从飞机发动机改装而成,变成了固定式发电厂。<p>它们并不是为了作为主要电源进行连续地面操作而设计的。<p>想想这意味着什么。<p>在孟菲斯,埃隆·马斯克的xAI在一个以黑人为主的社区运行了35台燃气涡轮机。这些是专门设计的涡轮机,配备了排放控制装置。然而,设施附近的二氧化氮水平仍然上升了79%。癌症风险已经是全国平均水平的4倍,进一步上升。<p>居民们是通过新闻稿得知这一消息的。噪音达到了90分贝。人们在窗户上放置床垫。 </i><p>https://www.linkedin.com/feed/update/urn:li:activity:7387850454958911488/
我们的小团队(3名开发者,1名艺术家)在这里分享我们的第一款游戏:BALL x PIT,这是一款以物理为基础的球类战斗生存类Roguelite游戏。
主要特点:
- 独特的球类型(炸弹、黑洞等),具有不同的反弹效果
- 通过清晰的融合实现42种进化(没有随机解锁)
- 基地建设,提供永久性的游戏增益
游戏上线5天:销售超过30万份,Steam好评率95%。现已在PC、PS5、Xbox(Game Pass免费)和Switch(售价14.99美元)平台发布。
欢迎提问,我们正在准备更新,增加更多的融合内容。感谢关注!