返回首页
最新
我在使用苹果的新 iOS 26 Foundation Models 框架时遇到了一个常见问题。由于训练截止日期的原因,所有主要的语言模型(如 GPT-4、Claude、Gemini)对此一无所知。
为了不必等几个月进行模型更新,我花了两个小时构建自定义训练数据:
研究:利用 Gemini 的深度研究,爬取所有可用的文档、论坛、GitHub 仓库、Reddit 讨论串和 YouTube 字幕,寻找“iOS 26 Foundation Models Framework”。
优化:让 Claude 将所有内容重组为干净的、层次分明的 Markdown 格式,以便于语言模型的处理。
实施:将其加载到 Claude Projects 中,作为自定义知识层。
结果:从“我没有相关信息”变成了对前沿 API 的专家级指导。我的开发工作流程从反复试验转变为顺畅的 AI 辅助实施。
这项研究非常全面,甚至引用了我前一天在苹果开发者论坛的帖子——形成了一个奇怪的递归循环,我在用我刚刚贡献的知识训练 AI。
这种方法适用于任何新的框架或 API。这个模式是可预测的:每次重大发布都会产生一个临时的知识空白,而自定义训练数据可以填补这个空白。
技术写作及方法论详见:https://rileygersh.medium.com/how-i-gave-claude-gemini-knowledge-of-ios-26s-foundation-models-03395d7e905c
我很好奇一些事件驱动技术,比如Kafka(或其他替代方案)是如何融入大型大语言模型(LLM)提供商的后端和/或基础设施的。
我心中有一些问题,主要包括:
1. 大型LLM提供商是如何处理训练数据、评估结果和人类反馈的流动的?这些是通过事件流(如Kafka)进行实时处理,还是更依赖于批处理和传统的ETL流程?
2. 对于复杂的机器学习管道(例如数据摄取 -> 预处理 -> 训练 -> 评估 -> 部署),他们是使用事件驱动的编排,每个阶段发布一些完成事件,还是使用像Airflow这样的传统工作流编排工具,通过轮询管理依赖关系?
3. 他们是如何处理实时性能监控和安全信号的?这些是能够触发即时响应(如模型回滚)的事件驱动系统,还是主要是批量分析,反应有些延迟?
我基本上是在试图理解事件驱动范式在现代人工智能基础设施中的适用程度,如果有人在这方面工作过或正在工作,任何高层次的见解都将非常欢迎。
嗨,HN,
我是一名刚毕业的计算机科学专业学生。在过去的几个月里,我编写了BinaryRPC,这是一个基于现代C++20的开源RPC框架,专注于低延迟的二进制WebSocket消息传递。
为什么我会构建它:
* 希望拥有一流的会话支持、可插拔的QoS级别以及一个简单的中间件链(全局、特定、多处理程序),而无需额外的JSON/XML解析。
* 提供良好的开发者体验。
快速功能列表:
* 二进制WebSocket帧——最小开销
* 内置会话层(登录/重新连接/心跳)
* QoS1/QoS2,带自动确认和重试
* 插件系统——房间、msgpack等可以一行代码添加
* 线程安全核心:RAII + folly
这个项目还处于早期阶段(个人项目),因此任何关于设计、并发模型或缺失的必备功能的反馈都将非常有帮助。
感谢您的阅读!
另外,请查看“使用BinaryRPC在5分钟内构建聊天服务器”:[https://medium.com/@efecanerdem0907/building-a-chat-server-in-5-minutes-with-binaryrpc-qos2-session-management-and-room-plugin-ccb66d722466](https://medium.com/@efecanerdem0907/building-a-chat-server-in-5-minutes-with-binaryrpc-qos2-session-management-and-room-plugin-ccb66d722466)
嗨,HN!<p>我是Elara的开发者,这是一款自动扫描您代码中的安全问题的工具,包括配置错误、秘密信息和风险包,让您可以专注于开发,而不必担心这些问题。它的设计简单且快速。<p>我看到很多人在网上发布产品,却对可能存在的安全风险一无所知。如果您是开发者或对技术感兴趣,您就知道保持系统安全有多么困难。然而,令人震惊的是,似乎没有人真正关心这个问题。<p>我希望帮助大家尽早发现这些问题,以免遭受损失。<p>Elara可以同时运行多个安全扫描器,将结果汇总到一个界面中,并为您提供一个可操作的待办事项列表,以解决这些问题。<p>尝试起来非常简单,只需用GitHub登录,亲自体验一下。<p>非常期待您的反馈!