1作者: Dbuild8 个月前原帖
我几个月前开始这个项目,但因为事情失控而停止了……然后出现了克隆大赛。 <a href="https://github.com/DimitriGilbert/LiteChat">https://github.com/DimitriGilbert/LiteChat</a> <a href="https://litechat.dbuild.dev/" rel="nofollow">https://litechat.dbuild.dev/</a> 100% 客户端实现,支持历史记录和多个提供者,包括 Ollama 和 LMStudio(不过与 openrouter 配合效果最佳)。 自动标题、多模态附件、再生、分叉和摘要功能。 可编辑的响应和带版本历史的代码块。 您可以同时测试多个模型,甚至可以组合它们的响应。 一个支持 Git 的虚拟文件系统,以及通过 Git 进行的工具和对话同步。 支持 MCP 服务器,提供的桥接器支持标准输入输出。 扩展的块支持,包括 MermaidJS、react-flow 和 Formedible 支持(<a href="https://dimitrigilbert.github.io/Formedible/" rel="nofollow">https://dimitrigilbert.github.io/Formedible/</a>)。 因为复制/粘贴/替换太麻烦了,所以我提供了一个提示库、代理(及其任务)和使用库/任务中的提示和转换步骤的顺序工作流。每个步骤会自动为下一个步骤提供所需的输出格式(如果需要的话)在其系统提示中。 简而言之:我想要深入使用 AI,但在 <a href="https://t3.chat">https://t3.chat</a> 上错过了一些功能,所以我自己打造了一套工具! 虽然它说不上好看,但确实可用 :) 为什么呢 => <a href="https://github.com/DimitriGilbert/LiteChat?tab=readme-ov-file#why-">https://github.com/DimitriGilbert/LiteChat?tab=readme-ov-file#why-</a>
1作者: mrkiouak8 个月前原帖
这是我启动的一个项目,目的是为了更好地利用各种大型语言模型(LLM)应用。我对生成的一些角色设计感到惊讶,效果非常好: 1. [这个角色](https://ki-storygen.com/characters/public/BARSKIN_BARTHOLOMEW_001)来自于《卡萨布兰卡》中瑞克的象形版本。 2. [这个角色](https://ki-storygen.com/characters/public/PNGR_BORIN_001)则是基于一个相当普通的粗犷矮人战士的描述,只是将矮人替换成了企鹅。 我正在使用谷歌云平台(GCP)的Veo进行视频生成(Veo 2,按照我的理解,Veo 3仍然在一个我尚未获得批准的白名单中),而GCP的伦理人工智能检查似乎非常严格,拒绝生成任何模糊的人类形象(包括上面的企鹅)。因此,像大象、乌龟、老鼠等动物成为了视频生成的最佳结果。 我很想听听大家的看法——我知道生成式人工智能与艺术/娱乐是一个非常敏感的话题,但我也认为像这样的有趣应用并没有取代任何人的工作。 而未来的“女士插图启蒙书”,类似于《钻石时代》,将会非常酷。
4作者: jackmenotti8 个月前原帖
我是一名程序员,主要从事各种用户界面(UI)的开发。无论是桌面应用、游戏还是网页,我都做过。虽然有人称我为前端开发者,但我认为这个称谓最近被赋予了许多负面情绪(有些是应得的,有些则不是)。无论如何,我热爱在任何表面上渲染内容,对用户界面/用户体验(UI/UX)充满热情,并坚信在任何环境中做好UI/UX都是非常困难的。与我多年来遇到的许多开发者不同,他们喜欢批评用户界面,并低估构建成功用户体验的复杂性,尤其是在需要处理多种分辨率、高性能图形渲染、流畅动画、效果/着色器、可访问性、可用性等诸多因素时。 最近,我看到关于人工智能代理(AI Agents)出现了许多有趣的讨论,讨论它们如何塑造人类互动的未来,使用户界面变得过时,并扰乱用户界面设计,或者威胁那些通过自身用户界面掌控数据/服务的公司。如果他们不适应并开发人工智能代理集成,可能会被淘汰,但这种集成的代价可能是大型科技公司的人工智能锁定。这让我思考了很多,我并不担心自己的工作,实际上我对此充满热情,但也有一些不确定性。因此,我在这里列出了一些观点,真的很想听听这个社区的意见。 * 聊天机器人或代理仍然是一种用户界面,只是以不同的形式呈现的用户体验?我个人认为聊天机器人是“专业化”的用户界面,就像我认为游戏一样。 * 聊天机器人的回复已经嵌入了丰富的小部件,以改善用户体验,有时没有什么比一个老旧的表格更适合展示结构化数据,因此我并不认为用户界面组件会消失。 * 那么,谁会阻止人们在 booking.com 上开发一个代理集成,生成一个在我的主屏幕上显示当前优惠摘要或价格跟踪图表的丰富小部件呢? * 即使所有的交互都是音频,我们仍然需要制定一些“音频用户体验”指南,以创造出色的音频体验,不是吗? * 在漫长的交互列表中,我觉得我们可能会想要看到和/或触摸某些东西,我是说我们仍然是人类,人类喜欢可以触摸的物理事物,比如按按钮。 * 我们也不应忘记用户界面可能作为备用或出于可访问性目的而存在,因此我看不到用户界面会消失,反而可能会变得多模态和适应性更强? 你怎么看?