1作者: zxzxy198820 天前原帖
我花了6周时间构建了 www.nex.design,这是一个针对电子商务的人工智能广告代理。它能够发现病毒式社交广告,复制其经过验证的结构,并大规模生成可用于生产的创意内容。 背景:我来自微软,专注于算法和后端开发。没有Node.js或前端的经验。这是我与Claude Code作为主要编码伙伴一起完成的。 我学到了什么: 第1-2周:人工智能在冷启动方面表现出色。在几个小时内,我就搭建了一个可工作的tldraw画布、Cloudflare Workers、图像生成和身份验证功能。 第3-4周:遇到了上下文窗口的瓶颈。我发现了8个组件中有重复的fetch()调用,3种不同的信用验证实现,以及Stripe webhook之间的竞争条件。人工智能会根据你当前的要求构建东西——它并不考虑系统的整体架构。 第5-6周:与一位经验丰富的工程师合作。他并没有写太多新代码,而是删除了一些东西。代码库变得更小但更稳定。 我的生产力技巧:使用3个终端窗口,2个Claude实例在独立功能上同时工作,而我进行审查。并行化有助于提高效率,但也加剧了重复性问题。 关键见解:人工智能 + 经验丰富的工程师 = 10倍效率。人工智能 + 缺乏经验的开发者 = 3倍效率,但会带来技术债务。 向HN提问:你们如何处理人工智能辅助的前端工作?人工智能无法看到用户界面。它不会注意到按钮偏移了2px,或者在移动设备上间距看起来不对。有任何工作流程可以缩短这个视觉反馈的循环吗? 欢迎尝试。如果有用,代码HN50(前100名享受50%折扣)和HN20(前1000名享受20%折扣)。 <a href="https://www.nex.design" rel="nofollow">https://www.nex.design</a>
2作者: mister_mort20 天前原帖
YouTube支持几种基本的视频字幕形式,但最先进的形式来自他们的YTT/SRV3文件格式。<p>这种格式支持其他字幕格式所没有的选项,包括粗体/斜体/下划线、自定义颜色和文本及背景框的透明度、轮廓和阴影、替代字体和字体大小、在视频上任意精确定位、垂直文本以及适用于亚洲语言的注音文本。(列表摘自这篇有用的用户报告帖子:https://www.reddit.com/r/youtube/comments/1qdvgmc/uploading_srv3_subtitles_got_brokendisabled/)<p>使用这种格式是为了生成与屏幕上实际文本匹配并原生替换的字幕,生成颜色匹配多个不同发言者的字幕,以便于识别,等等。<p>一些使用示例包括(这些视频包含恐怖电影内容警告):<p>https://www.youtube.com/watch?v=eHcHjcV8SNY - “无意识的安魂曲”,其中字幕闪烁并变换颜色,以匹配屏幕上闪烁和展开的文本<p>https://www.youtube.com/watch?v=3iUgKH8c7p4 - “现在重试”,其中字幕的样式与视觉小说文本框中出现的对话相匹配<p>用户现在报告提交带有高级字幕的视频无法正常工作。<p>这不仅仅是对新视频禁用——一些用户现在报告旧视频的自定义字幕被删除,包括那些观看次数超过1000万的。<p>希望这个变化能够恢复,但你应该下载任何你希望保留的视频的字幕。