LLM 上下文窗口快满了?我在生产踩过的3种应对方案与坑
上下文越来越长,模型却开始答非所问 用 LLM 做应用开发,最怕的不是模型不够聪明,而是上下文窗口越来越不够用。 我接手过一个客服机器人项目,上线第一个月效果很好。第三个月开始,用户频繁...
GitHub Actions 环境配置的两个真实坑:inputs默认值和secrets作用域
用 GitHub Actions 的 workflow_dispatch 配合 environment 字段,蓝绿部署、灰度发布都能搭。但跑起来有两个容易踩的坑:inputs 的默认值在特定触发方式下不生效,以及 environment secrets 在...
GitHub Actions fail-fast 陷阱:我的矩阵任务被团灭始末
问题场景:12 个矩阵任务被「团灭」 用矩阵策略跑 12 个测试组合,一个组合失败了,另外 11 个正在运行的任务全部被 GitHub Actions 强制取消,白跑了 40 分钟。 这不是网络波动,是 fail-fast ...
GitHub Actions cron + 矩阵策略:定时触发多版本测试完整方案
解决什么问题 每天凌晨自动跑「Python 3.10 / 3.11 / 3.12 × Ubuntu / Windows / macOS」共 9 个组合的测试,或者每周一检查依赖有没有安全更新。GitHub Actions schedule 触发器配合矩阵策略...
GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑
# GitHub Actions pip 缓存总失效?我踩过最深的 4 个坑 GitHub Actions 的 pip 缓存用不对,每次 CI 都重新下载几千个包,多花 1-3 分钟。本文记录我实际踩过的 4 个缓存失效场景,给出可直接...
GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢(临时标题)
GitHub Actions 缓存失效的根因与解法:同一个 workflow 为什么时而快时而慢 同一个 workflow,第一次跑 3 分钟,第二次跑 40 秒,第三次又回到 3 分钟。换了台机器反而更快。不是网络问题,不...
GitHub Actions docker login-action v3 三个真实坑:权限/作用域/缓存不统一
# GitHub Actions docker login-action v3 三个真实坑:权限/作用域/缓存不统一 用 GitHub Actions 跑 Docker 构建,registry 认证是最基础的操作,但 docker/login-action@v3 这个 Action 在自...
GitHub Actions 缓存失效的隐藏战场:restore-keys 与跨 runner 路径陷阱
场景 每次 Push 都重新安装依赖,CI 运行时间从 40 秒飙到 4 分钟。`actions/cache` 配了、`restore-keys` 也有,但缓存依然每次都重新下载。 这不是幻觉。`actions/cache` 有两个陷阱,即使读...
RAG 上下文压缩后缓存失效的根因与三个解法
# RAG 上下文压缩后缓存失效的根因与三个解法 用 RAG 跑生产环境时,上下文压缩(Context Compression)是个好东西——能显著减少 token 用量、降低 LLM 调用成本。但有一个副作用很多人会遇到...
让 AI 真正懂你:打造个人化的本地编程助手
用 AI 写代码快一年了,从最初的新鲜感,到现在越来越觉得:工具本身差不多,关键在于你怎么用它。 prompt 写得好不好,决定了 AI 给你的答案质量。我见过很多人抱怨 AI 不听话,给了上下文还是...
上下文压缩后 RAG 检索降级的 4 种应对策略
问题:压缩后 Embedding 变了 给 RAG 对话系统加上上下文压缩(对话历史摘要化)后,向量检索缓存命中率从 60% 跌到接近 0。这不是缓存本身坏了,而是压缩改变了对话历史的向量空间:同一个问题...
Docker BuildKit 缓存失效的 5 个真实场景:GitHub Actions CI/CD 提速避坑指南
Docker BuildKit 缓存失效的 5 个真实场景:GitHub Actions CI/CD 提速避坑指南 明明什么都没改,GitHub Actions 的 Docker 镜像构建每次都从零开始。层缓存失效是 CI 慢的根因,但 BuildKit 在...













