返回首页
最新
我在美国的一所R1公立大学攻读计算机工程博士学位。这是我一直想做的事情,因为它让我能够深入研究各种课题。然而,事实证明我最初的想法并不是全部真相。
我即将进入博士生涯的第二年末。我的导师专注于高性能计算(HPC),但并没有进行前沿研究,而我想从事高效硬件人工智能研究(例如更快的内核、机器学习系统等)。每当我阅读论文,看到作者及其成就,以及他们背后的团队和那些著名学校/实验室时,而我却深陷于某个cuBLAS函数中,希望能将寄存器分块的优化提高到纳秒级别,我就感到自己像个失败者。我不知道该研究什么问题。我开始怀疑我想做的事情是否真的需要博士学位。
我在想,是否有可能像麻省理工学院或斯坦福大学的实验室那样,能做出任何可发表的成果,毕竟他们的团队中有那么多杰出的人才?外面的知识太多了,我所不知道的事情也越来越多。我越是觉得自己了解,就越会有新的问题出现。我原以为自己终于理解了大语言模型(LLMs)的细节,但新的注意力机制变种又不断涌现。我不确定自己是否能阅读到足够的资料,以便进行研究。我希望在博士毕业后能在美国找到工作(回国让我感到恐惧),而且我还是国际学生,所以放弃并不是一个选项。
我在寻找任何建议,如果你有类似的经历,任何帮助都将不胜感激。谢谢。
多年来,我一直陷入困境。被困在一个循环中。每一个新项目,每一个团队倡议——都以同样令人沮丧的开局开始。<p>时间。消耗殆尽。不是在<i>实际工作</i>上,而是在元工作上。定义任务。草拟表单。绘制工作流程。寻找那个“完美”的模板,但总是无法完全契合。只是想要回到零点。到一个可以真正开始有意义工作的起点。<p>大多数项目管理工具?一旦事情开始运转,它们非常出色。跟踪、协作、报告——它们做得很好。但那初始的空白画布呢?当你盯着一张空白页面,被迫使用一个并不完全适合你思维的僵化模板时?它们让你感到无助。你仍然是初始<i>系统</i>的设计师,而不仅仅是其中任务的管理者。<p>这种挫败感?终于爆发了。它迫使我们思考:如果这个初始设置不是一张空白画布呢?如果一个人工智能不仅仅是建议任务,而是<i>为你的工作空间构建整个结构</i>呢?<p>这就是FlowTask的核心理念。想象一下,一个为你生成的全面蓝图。我们谈论的是完整的任务层级描述、分配人、截止日期、依赖关系,所有这些都经过逻辑组织。表单也是如此。生成时包含正确的字段文本、数字、日期、下拉菜单和智能验证规则,具有上下文感知。而工作流程呢?定义的状态、过渡,准备好供你使用无代码构建器或内部系统。所有这些。<p>‘如何’的部分就变得复杂而令人兴奋。这不仅仅是将提示扔给大型语言模型(LLM)并希望得到不错的文本。我们正在构建一个结构化的人工智能生成层。把它看作是一个项目组件的模式生成器,而不是简单的文字生成器。我们正在推动精细调优的模型和复杂的提示工程,以确保输出不仅仅是合理的,而是<i>结构化的</i>。<i>系统就绪的</i>。这就是通过引导模型朝着具体、明确的输出方向来解决“幻觉”问题。<p>我们正在解决这个初始项目“冷启动”的问题。将数小时的行政工作压缩到几分钟。这并不是要取代人类的智慧,而是要自动化那些真正乏味、非创造性的工作。<p>我们在这方面已经努力了一段时间。现在我们需要你毫无保留的看法。你看到的雷区是什么?你目前是如何启动新项目的?什么样的结构化输出实际上能帮到你?<p>让我们聊聊。很高兴深入探讨技术或具体用例。
亚航客户服务电话:0812909668,您可以通过WhatsApp联系0812-909-668,服务时间为每天24小时。
我一直在为开放源情报(OSINT)分析师开发一个浏览器自动化系统。我之所以开始这个项目,是因为现有的工具存在一些问题:
1. 它们需要用户对系统需要完成的任务有更精确的理解(例如,去这里,点击这里,然后做这个,再做那个等)。
2. 要执行复杂任务,现有的少数工具需要用户对系统本身有一定的了解(例如,告诉它调用特定的函数或类等)。
我这个项目的目标(我称之为“pyba”)是将所有操作从用户的角度进行抽象化。我内置了两种“探索”模式,分别是深度优先搜索(Depth First Search),在这种模式下,它会选择一种思路并完整执行,然后再回退;以及广度优先搜索(Breadth First Search),在这种模式下,它会并行执行多个相关的计划。
分析师只需用文字输入他们已经知道并愿意分享的内容,以及他们希望进一步了解的内容。为了确保在这个过程中没有障碍,我还硬编码了登录信息,它会从环境中读取您的凭据,并自动登录到像 Gmail、Facebook 和 Instagram 这样的网站(这样您的凭据就不会传送到大型语言模型中)。
当然,您也可以用它来做一些普通的事情(比如,如果您想的话,可以让它为您滚动短视频)!
我是一名从产品经理转型为独立开发者的开发者,目前正在构建Promptsref,这是一个经过精心挑选的Midjourney SREF库,包含完整的提示、图像和示例。
Promptsref可以帮助你:
- 快速发现优秀的SREF风格,无需在X/Discord/付费PDF中翻找
- 重用完整的提示和SREF,以可靠地再现某种风格
- 按“氛围”(如漫画、赛博朋克、电影剧照等)进行探索,而不是猜测关键词
我为什么要构建它:
我在对Midjourney感到沮丧后开始了Promptsref。作为一个初学者,我总是看到令人惊叹的风格,但它们往往:
1. 埋藏在冗长的X线程或Discord聊天中
2. 仅以代码或部分提示的形式分享
3. 几乎不可能在后续中可靠地再现
我想要一个可以保存那些始终看起来不错的风格的地方,并且在一个地方集中存放确切的提示、SREF和示例图像。这个想法慢慢演变成了这个项目。
它是如何工作的:
在Promptsref上,每个SREF我都会存储:SREF代码、我使用的完整提示、示例图像(有时还有视频风格)。
你可以通过标签和“风格氛围”进行浏览,复制你喜欢的代码,将完整提示粘贴到Midjourney中,通常在几次生成中就能获得类似的结果。我会根据我自己工作中使用的风格和网站周围的小社区似乎喜欢的内容来更新库。
技术细节:
前端:Next.js,部署在Vercel上
后端:Supabase/Postgres用于存储SREF、提示、元数据和收藏
我学到的东西/需要解决的问题:
为非技术创意者设计搜索功能比简单地“添加搜索框”要困难得多。
在Midjourney更新模型时,保持SREF的实用性需要修剪和重新策划。
人们非常关注一致性(系列、品牌、漫画),而不仅仅是一次性的漂亮图像。
我希望获得的反馈:
如果你使用Midjourney,我非常希望能得到以下方面的反馈:
- 搜索/导航是否易于理解?
- 关于某种风格,你希望首先看到哪些信息?
- 是否有更好的方式来展示风格的系列/集合?
- 对于技术栈或数据模型,你有什么明显的改进建议?
链接: [https://promptsref.com](https://promptsref.com)
感谢你的阅读,我很乐意回答关于实现、数据模型或SREF策划过程的任何问题。
我是一个独立的iOS开发者,开发了一个小工具,因为我在App Store上找不到简单、快速且尊重隐私的文档扫描仪。
如今大多数扫描仪都需要注册账户、将文件上传到云端,或者强推订阅。我想要一个能够快速打开、离线工作、导出干净PDF且不追踪任何信息的工具。
于是我制作了Scan。
它的打开速度与相机应用一样快,文档处理在本地完成,不需要账户。设计灵感来自于iOS 6时代的旧版简洁UI,因为我一直喜欢那种干净和快速的感觉。
我非常希望能得到反馈,尤其是来自其他开发者的意见:
– 交互流程是否足够直观?
– “隐私优先 + 复古设计”的方向在2025年是否合理?
– 1.0版本中是否有明显缺失的功能?
欢迎提问。