返回首页
最新
嘿,HN!我希望能找一些人来试试我为学习DSPy而制作的小项目!我一直是小说和网络小说的忠实读者,对两个问题充满好奇:大型语言模型(LLMs)如何能够根据读者反馈逐步学习写得更好,以及哪些LLMs在创意写作方面实际上表现最佳(研究基准很酷,但不一定能转化为现实世界的使用)。
这正是我创建 narrator.sh 的原因!这个平台接受用户输入的小说创意,然后通过使用 DSPy 根据真实的读者反馈逐章生成连载小说。我使用了链式思维(CoT)和并行模块来分解写作任务,精炼模块和将LLM作为评判者的奖励函数,以及SIMBA优化器来重新编译之前章节的用户评分,以改善后续章节。
与其使用合成基准,我追踪真实的读者指标:阅读时间、评分、书签、评论和回访。这创建了一个排行榜,显示哪些模型实际上写出人们想要完成的引人入胜的小说。
目前,关于创意写作LLMs的评估主要来自作者的视角(例如OpenRouter对Novelcrafter等工具的使用数据)。但最终决定好坏的还是读者,而不是作者。
你可以在这里试试:<a href="https://narrator.sh" rel="nofollow">https://narrator.sh</a>。这是当前的排行榜:<a href="https://narrator.sh/llm-leaderboard" rel="nofollow">https://narrator.sh/llm-leaderboard</a>(现在有点空荡荡的,因为用户不多,哈哈)。
(友情提示:由于我在Reddit上发布了寻找测试者的帖子,导致一些人对提示进行了创意发挥,因此有一些成人内容。我正在努力丰富内容!)
我一直在使用Cursor进行一些非编码任务,效果非常好。问题是VS Code IDE是为编码设计的,我需要一个更好的界面来处理这些非编码任务。于是我开发了一些扩展来添加自定义层:
1. CSV查看器,用于数据分析,将CSV文件呈现为可编辑的电子表格。
2. 幻灯片制作器,将.md文件呈现为幻灯片,并可以通过Cursor代理进行创建和编辑。
3. 国际化管理器,将多个翻译文件加载到一个表格中并并排显示,同时Cursor通过代理更新翻译。
为了让每个人都能使用这个工具,我将核心组件开源为一个工具包,可以用来快速编码自定义扩展。它配备了一个强大的提示模板,通过添加您的需求,您只需一个提示就能获得一个完全可用的扩展。
我这样做部分是为了实验,看看在人工智能时代,软件分发是否可以通过快速编码的帮助,让用户参与到最后一公里的贡献中。
我使用OpenAI API进行命名实体识别(NER)任务以及基于方面的情感分析,效果相当不错。最近,有人问我是否可以通过在聊天界面上传文本来让ChatGPT进行同样的分析。我尝试了一下,发现与我从API获得的结果相比,效果相当差。原因在于ChatGPT只是编写Python代码,并使用现成的自然语言处理模块来执行这个任务。
你有什么建议可以解决这个问题吗?我希望ChatGPT生成文本,而不是Python代码,并执行那段代码。
我注意到,除非是在聚会上,否则很难找到并结识附近的其他创业者。我一直在尝试制作一个简单的地图,让创业者可以看到附近的人,并安排一些活动,比如喝咖啡聊天或共同工作日。某些群体可以进行筛选(如YC校友、自筹资金的创业者、本地加速器等)。
我很想知道你目前是如何在你所在地区结识其他创业者的。像这样的工具真的有用吗,还是你发现现实生活中的会议有其他方式?
大家好,我们是 Aram 和 Eduard,Modelence 的作者(<a href="https://github.com/modelence/modelence" rel="nofollow">https://github.com/modelence/modelence</a>),这是一个为热爱 TypeScript 和 MongoDB 的团队提供的全能后端平台。可以把它想象成 Supabase,但针对 MongoDB:包括身份验证、定时任务、电子邮件、监控,且在交付之前无需编写额外的连接代码。
正如 Karpathy(以及我们许多人)所指出的,从原型到生产的过程大多是痛苦的集成工作。虽然各个组件都存在,但将它们可靠地组合在一起才是困难之处:<a href="https://x.com/karpathy/status/1905051558783418370" rel="nofollow">https://x.com/karpathy/status/1905051558783418370</a>。YC AI Startup School 也讨论了这个问题 - <a href="https://www.youtube.com/watch?feature=shared&t=1940&v=LCEmiRjPEtQ" rel="nofollow">https://www.youtube.com/watch?feature=shared&t=1940&v=LCEmiR...</a>
我们打算填补这些空白!您可以开箱即用的功能包括:
- 身份验证 / 用户管理
- 数据库
- 电子邮件集成(第三方,但用户验证邮件等功能开箱即用)
- AI 集成
- 定时任务
- 监控 / 远程监测
- 配置和密钥
- 分析(即将推出)
- 文件上传(即将推出)
运行方式:一个基于 Node.js 的后端,使用 MongoDB。它与前端无关,因此您可以使用我们最小的 Vite + React 启动器,或者将 Modelence 放在现有的 Next.js(或任何其他)前端后面。
我们还在构建一个托管云,类似于 Vercel 对于 Next.js 的作用,但 Modelence 专注于后端而非前端(Vercel 非常适合内容网站,如着陆页、博客等,但持久连接和复杂的后端逻辑很快会超出其能力)。您可以在这里找到一个快速演示:<a href="https://www.youtube.com/watch?v=S4f22FyPpI8" rel="nofollow">https://www.youtube.com/watch?v=S4f22FyPpI8</a>
我们正在寻找早期用户(特别是使用 MongoDB 的 TypeScript 团队)。请告诉我们您觉得缺少什么、哪些地方让您困惑,以及在将其投入生产之前您希望看到什么。我们乐意回答任何问题!