2作者: nikhonit大约 2 个月前原帖
我开发这个工具是因为我在YouTube上观看了大量的技术讲座和长篇播客,但发现自己常常浪费几个小时在视频中寻找特定的引用或概念。 Recapio是一个提取视频(和网页文章)转录文本并生成结构化摘要的工具。它并不是试图取代观看内容,而是作为视频内容的“Ctrl+F”功能。 我面临的一个技术挑战是:处理自动生成的YouTube字幕与强制字幕之间的混乱。我不得不构建一个解析器,以规范时间戳,这样当你点击摘要点时,它实际上能够跳转到正确的画面,即使字幕的时间有所偏差。 它有一个免费的使用层级,应该能够满足大多数普通用户的需求。我很希望能听到你对提取质量的反馈。
1作者: zfoong大约 2 个月前原帖
很高兴地宣布,我们刚刚推出了白领助手——一个开源的通用计算机使用AI助手,帮助您通过TUI界面自动化计算机任务(<a href="https:&#x2F;&#x2F;github.com&#x2F;zfoong&#x2F;WhiteCollarAgent" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;zfoong&#x2F;WhiteCollarAgent</a>)。<p>该助手能够自主理解您的指令,规划行动并执行任务,以实现广泛的自动化目标。代码也为构建您自己的AI助手提供了基础。它可以执行网络任务并自动化操作系统的操作,如高频重复工作和批处理。<p>想将整个文件夹的文档翻译成日语吗?根据每个文件的内容整理一个杂乱的文件夹吗?扫描一文件夹的图像并为每个图像自动生成标题吗?这些任务都可以通过白领助手轻松实现自动化。<p>附注:您可以自由使用、托管甚至将白领助手进行商业化。如果您是AI工程师或开发者,系统中有一个自定义助手层,允许您创建可以托管的专用助手。您只需注入助手的身份和自定义工具即可。<p>GUI模式仍处于实验阶段。如果您有开发GUI助手的经验,我们邀请您与我们合作(请与我们联系!)。
2作者: nishilpatel大约 2 个月前原帖
我正在寻找高质量的工程博客文章的例子,特别是来自科技公司博客的,这些文章能够超越表面层次的解释。<p>我特别感兴趣的文章包括: 1. 清晰简明地解释技术概念 2. 展示真实的实施细节、权衡和失败经验 3. 结构良好且易于阅读 4. 将工程决策与业务或产品结果联系起来<p>你有没有特别推荐的博客、文章或平台,能够让你定期学习?
7作者: brinedew大约 2 个月前原帖
我制作了一个受到Geoguessr和Wordle启发的网页游戏,每天你会看到一个随机的人类蛋白质的3D模型,然后你需要根据相似性线索推测出它的基因名称。 我的背景是湿实验室的分子生物学,我希望这个游戏主要吸引其他生物学家。但如果你不在这个领域,我也很想知道你是否能通过浏览器使用大型语言模型(LLMs)来解决这个问题,以及在这个过程中是否学到了有趣的东西。请告诉我你的想法。 在过去的两个月里,我和Claude一起制作了这个游戏。我的编程经验仅限于基本的Python数据分析和图表制作。我看到网上有人在问:“既然我们有了编码AI,为什么没有大量非编码者制作的精彩AI生成应用?”如果这听起来像你,欢迎查看Geneguessr,了解一个非编码者制作的网页应用是什么样的。 如果有需求,我可能会写更多关于这个过程的内容,但真正推动Claude项目进展的是Linear MCP,它可以将每个单独的问题放在共享的看板上。这个工具和用于在实时网站上进行测试的Playwright MCP是我完成这个项目的两大助力。对于Claude无法一次性解决的bug,Linear非常适合整合问题信息,以便我可以将其输入到ChatGPT Codex中——它通常会思考大约半个小时,给出非常混乱的解释,但问题最终解决了。 游戏是免费的,不需要登录,如果你在移动设备上遇到任何bug,我很抱歉——我在那方面测试得不多。 <a href="https://geneguessr.brinedew.bio/" rel="nofollow">https://geneguessr.brinedew.bio/</a>