我一直在与一个来自新加坡AWS的爬虫“Mozilla/5.0 (compatible; crawler)”斗争,它对我的一个域名发送了大量请求,平均每秒超过700个请求,持续了几个月。
幸运的是,CloudFlare能够通过简单的WAF规则和444响应来处理这些流量,从而减少出站流量。
我向AWS提交了几次投诉,希望能停止这种流量,他们的典型回复是:
我们已与客户进行了沟通,并根据这次沟通确定,报告的活动目前不需要AWS采取进一步行动。
我尝试了各种4XX响应,看看爬虫是否会退缩,也尝试了30X重定向(它会跟随),但都没有效果。
这种流量已经达到需要我重新与CloudFlare谈判合同的程度,并且在查看分析和日志时也造成了困扰。
我考虑将所有流量重定向到AWS的滥用报告页面,但在这种情况下,这实际上就像一个小型DDoS网络,发送到任何地方都可能被视为滥用。
有没有其他人有类似的经历?
返回首页
最新
我看到ChatGPT在数到一百万时失败,理由相当离谱,而用户也无法绕过这个问题。<a href="https://www.youtube.com/watch?v=djZVWc1PkIo" rel="nofollow">https://www.youtube.com/watch?v=djZVWc1PkIo</a>。
我和我的朋友尝试了几种变体来让它开始数到一百万,但都失败了。于是我们决定尝试看看能达到的最大数字。
我们尝试的方法包括:
- 将其框架设定为实验,挑战其他大型语言模型或它之前的表现,在小成功后给予鼓励。
- 逐步引导 - 先让它数到10、20、30、50等,算是有点成功,记录到110。
而最终的赢家是:
- 我们自己数到140,然后让它重复 - 成功!但后续的尝试惨败。没有再尝试更高的数字,因为遇到了每日限制 :D
有谁尝试过这个吗?你们能数到多高?到目前为止,我们在YouTube和谷歌上没有找到有人能超过140的记录。
来挑战我们吧。
你好,Hacker News!我们上线了!
我非常激动地宣布,YTVidHub终于正式推出了!这个工具旨在解决许多人在这里分享的一个巨大时间浪费问题:从大型YouTube语料库中手动下载转录文本的痛苦过程,特别是用于研究和数据分析。
问题:如果你需要为50、100个或更多视频获取字幕,目前的复制-粘贴-下载-重复的工作流程既缓慢又痛苦。
我们的解决方案(核心功能):YTVidHub专为真正的批量处理而设计。你可以将数十个YouTube网址(或播放列表/频道链接)粘贴到一个简洁的界面中,系统会提取所有可用的字幕(包括多语言自动语音识别),并将它们打包成一个有序的ZIP文件,方便一键下载。
架构洞察:我们的设计优先考虑“研究就绪”的数据,借鉴了这里HN的讨论。我们特别优化了纯文本(TXT)输出——去除了所有时间戳和格式,使其能够立即适用于RAG系统和LLM的处理。
商业模式:YTVidHub对于单次下载是免费的。批量操作每天提供5个免费积分,以确保公平使用并管理我们的处理成本。对于高容量数据需求,我们提供专业计划。
未来重点:我们知道自动语音识别的准确性是下一个大挑战。我们已经在开发一个专业的AI转录层,以提供高准确度、基于LLM的转录文本,解决小众内容和数据质量问题。
请试用我们的批量下载器,体验系统的性能。你对速度和TXT输出整洁度的任何反馈对我们的工程路线图都极为重要!
感谢你与我们共同建设。
展示HN:AICrop — 一款基于AI的本地图像调整工具,专为社交媒体设计(无需注册,隐私优先)
大家好 — 我很高兴与大家分享AICrop([https://aicrop.app](https://aicrop.app)),这是我和我的合作者Claude Code共同开发的一个简单工具,旨在解决我们在内容创作者和社交媒体用户中反复遇到的一个痛点。
问题 / 起源故事
每当我为社交媒体帖子或市场营销准备图像时,总会遇到一个繁琐的任务:将同一张照片裁剪或调整为不同的宽高比(Instagram、Twitter、TikTok、LinkedIn等)。手动进行这一操作既耗时又容易出错,尤其是当我希望主体(人脸、物体)在所有版本中保持居中并看起来自然时。
Claude Code和我决定:为什么不制作一个智能自动裁剪的工具,同时又尊重隐私——也就是说,图像永远不会离开用户的设备?
AICrop的功能
* 您上传一张照片(JPG / PNG / WebP,最大10MB),AICrop会在浏览器中使用TensorFlow.js完全进行对象/主体检测。
* 它会为主要社交平台(Instagram、Twitter、TikTok、LinkedIn、YouTube等)提供裁剪框,并即时预览。
* 如果需要,您可以手动微调结果。
* 无需服务器上传,无需账户,无水印——一切都在您的浏览器中本地完成。
我们通过“氛围编码”构建了这个工具——这是我和Claude Code之间一种迭代的、创造性的合作方式。我们没有严格的任务分工,而是动态地探索想法,让直觉和快速反馈循环推动进展。这不仅有趣,而且出乎意料地高效。
目前的准备情况
* 完全可用的浏览器版本,您今天就可以试用(无需注册)
* 支持主要社交媒体的宽高比和预览
* 手动调整和导出选项
* 100%本地处理,以确保隐私
我们希望获得的反馈 / 帮助
* 用户体验是否流畅直观?
* 还有哪些裁剪尺寸或平台我们应该添加?
* 我们是否应该开发批量处理或更智能的检测模式等功能?
* 关于可持续性的问题——您希望它保持免费、增值服务,还是开源?
* 有哪些库、模型或优化建议可以提高浏览器中的性能?
如果您尝试了AICrop,我很想听听您的想法、bug报告和改进建议。我会在评论区与大家交流——感谢您的关注!