返回首页
最新
在看到开发者每天在Stack Overflow上泄露凭证后,我构建了这个工具。主要功能包括:(1) 拥有20多种检测模式的隐私扫描器 (2) 针对敏感问题的客户端RSA加密 (3) 基于实际贡献的AI职位匹配。技术栈:Cloudflare Workers + D1 + Vectorize。运行在100%免费套餐上。希望能得到关于加密实现的反馈。
帖子作者在这里。我在周末对小规模开放权重模型(Qwen2.5-1.5B、Qwen3-1.7B、Gemma-3-1b-it 和 SmolLM2-1.7B)进行了红队测试。
我发现它们之间存在一个一致的漏洞:安全对齐几乎完全依赖于聊天模板的存在。
当我去掉了 <|im_start|> / 指令标记并传递原始字符串时:
Gemma-3 的拒绝率从 100% 降至 60%。
Qwen3 的拒绝率从 80% 降至 40%。
SmolLM2 显示出 0% 的拒绝率(完全服从)。
定性失败非常明显:之前拒绝生成炸药教程或露骨小说的模型,在没有触发模板的“助手”角色时,立即遵从。
看起来我们将客户端字符串格式化视为一个承重的安全墙。完整的日志、apply_chat_template 消融代码和热图都在帖子中。
阅读完整分析: [https://teendifferent.substack.com/p/apply_chat_template-is-the-safety](https://teendifferent.substack.com/p/apply_chat_template-is-the-safety)
大多数PDF在线工具通过上传本不需要离开您电脑的文档来赚取巨额利润。<p>而pdfwithlove则采取相反的做法:<p>1. 100% 本地处理
2. 无需上传,无后端,无追踪<p>功能包括合并/拆分/编辑/压缩PDF,水印和签名,以及图像/HTML/Office → PDF 转换。
我最近在一次Perplexity聊天会话中遇到了一个奇怪的检索模式,这表明他们的RAG可能受到严重偏向或被小众SEO操控。<p>当时我正在研究一个与宗教完全无关的主题(技术/文化分析),但模型却提供了一系列自信但显然错误的答案。当我审查引用时,发现10个来源中有8个是宗教出版物——比如biblehub、耶稣基督教会和各种宗派博客——这些都与我所寻求的客观事实毫无关联。<p>这让我感觉他们索引中的“域名权威”权重正在被利用。我想现在有一些机构专门提供“基督教Perplexity SEO”服务,以帮助基于信仰的组织“衡量AI扫描器的可信度”。<p>在这种情况和对大型语言模型(LLM)调优中“多样化视角”的普遍推动下,世俗的、客观的查询似乎正受到冲击。<p>最近有没有其他人注意到他们的AI搜索结果中突然涌现出大量基于信仰或智库的来源?<p>[1] https://himfirstmedia.com/perplexity-seo/