返回首页

24小时热榜

1作者: AymanJabr大约 11 小时前原帖
大家好,希望你们在这个前所未有的时期过得愉快。我在这个紧急时刻向大家求助……<p>目前有一些游戏系统,比如Renpy/Twine,它们提供沙盒环境,角色在特定场景中会有成长,可能还会有迷你游戏、可重复的场景、属性进展和随机元素。这类游戏需要开发者逐步手工制作,因此开发者需要编写故事、整理图像/音频/动画、编程属性/动画/随机事件,并管理不同事件的时间线。<p>另一方面,还有AI游戏,这基本上是一个大型语言模型(LLM),在其上添加了一些世界设定和角色的上下文。我当然是在谈论SillyTavern、character-tavern、infinite worlds等。这类游戏的问题在于,玩家往往会放纵自己,因为他们可以直接说:“然后我用一巴掌杀死邪恶的黑暗领主,找到龙珠,成为人类的至高皇帝,永远统治。”而且故事往往是有限的,感觉并不像是艺术家的创作,更像是一个带有一些风味的LLM。<p>我在考虑创建一种能够弥合这两种游戏世界之间差距的系统,类似于Twine/Renpy,但作为游戏开发者,你将创建检查点,在特定的里程碑上设置预设的对话/图像/场景,而不是为每个序列手工编写对话。<p>例如,假设我们正在玩一款恋爱游戏,玩家(杰克)需要勾引一个浪漫对象(吉尔),而不是重复多次选择或磨练,我们可以让AI在每次互动中将爱情值提高或降低1-5点,这样AI只能使用一个工具来调节这个值,而不会超出程序限制。只有在爱情值达到20时,关于(吉尔)如何运作的指令、图像和选择才会开放。至关重要的是,玩家必须在每个事件中通过输入(说话)与AI交流,以改变这个爱情值。<p>因此,功能将包括: - 玩家只能对话或采取某些行动(玩迷你游戏)。像“<i>然后我用一巴掌杀死邪恶的黑暗领主,找到龙珠,成为人类的至高皇帝,永远统治</i>”这样的短语将被AI解读为用户说的奇怪话。 - 游戏玩法仍然是一个封闭的故事,玩家必须逐步解锁更多功能。 - 这个想法的核心是限制玩家,剥夺他们立即实现任何目标的能力,同时仍然给予他们在特定环境中自由行动的空间。 - 限制玩家在一个时间循环中与AI的来回对话次数。<p>我见过扩展程序RPG Companion: https://github.com/SpicyMarinara/rpg-companion-sillytavern,但这似乎更多是试图跟踪属性,而不是直接控制它们。<p>我还找到了一篇Jacky Kaub的文章:https://towardsdatascience.com/how-i-built-an-llm-based-game-from-scratch-86ac55ec7a10<p>我想问你们的是,是否已经有类似的系统?如果没有,你们会在这个系统中添加哪些其他功能?
1作者: alexsmolen大约 12 小时前原帖
我在AWS安全领域工作多年,查询CloudTrail一直是个大麻烦——获取类似“这个角色在过去30天内实际使用了什么?”的数据,要么需要编写自定义查询和结果解析代码,要么只能从像Access Analyzer这样的内置工具中获取模糊的数据。 TrailTool的核心理念是在数据摄取时预先聚合CloudTrail事件为实体关系——人员、会话、角色、服务、资源——这样查询就变成了对DynamoDB的读取,而不是日志扫描。CLI直接使用标准AWS凭证与您的DynamoDB表进行交互,无需API层。 文章中的四个工作流程(ClickOps检测、最小权限策略生成、AccessDenied修复、紧急验证)都是我实际手动执行的任务。会话记录是真实的Claude Code运行结果,使用了该工具。 我想知道这对大家是否有用,或者是否还有其他CloudTrail问题可以通过这种方式预先计算,以完成常见任务。
1作者: dhruvghulati大约 12 小时前原帖
Clarity 是一个 Slack 机器人,旨在作为私人沟通教练,直接解决远程工作中最大的障碍:沟通不畅。通过使用大型语言模型(LLMs),Clarity 在您发送消息后分析内容,提供针对语气和清晰度等问题的即时自动编辑。 核心技术难点在于评估“良好沟通”,这本质上是主观的,无法依赖标准测试集。为了解决这个问题,我们设计了一个复杂的多LLM评估流程。一个强大的LLM合成了初步的标记测试集,第二个LLM作为精确度和召回率的评判者,第三个LLM则不断自动调整标记LLM的提示,从而提高了我们系统准确性的信心。此外,我们还建立了一个专门的代理,模拟 Clarity 在各种合成工作空间中的操作——这些工作空间涵盖了不同的行业、领域和在冲突情况下的人物,以进一步验证其性能。 我们有意将 Clarity 作为一个以个人为中心的产品推出,以降低使用门槛,战略目标是在转向团队模型(M1)之前建立使用基础。目前,我们正在寻求社区对该产品的反馈,以便在扩展我们的影响力之前进行改进。