AI AI 工具指南
首页 AI 工具教程 AI 场景化应用 AI 提示词库 关于
🌐 English
首页 / #llama-cpp

#llama-cpp

带有该标签的文章

常见问题解决库

llama.cpp 在网络盘上 mmap 失败

llama.cpp 从 NFS、SMB 或 CIFS 挂载的网络盘加载模型时报 mmap failed 错误。定位文件系统 mmap 限制、改用流式加载或本地缓存的修复方案。

2026/05/25 #local-llm #llama-cpp
常见问题解决库

llama.cpp 换更激进量化后质量明显下降

从 Q8_0 换到 Q4_K_M 或 IQ4_XS 后,模型输出质量骤降、逻辑错误增多。通过基准测评、量化选择与参数补偿策略恢复可用质量。

2026/05/25 #local-llm #llama-cpp
常见问题解决库

Chat template 不匹配导致输出全是乱码

本地 LLM 输出大量重复符号、乱码或毫无意义的 token 序列。通常是 chat template 格式与模型不匹配所致,定位模板来源并强制指定正确格式即可修复。

2026/05/25 #local-llm #llama-cpp
常见问题解决库

RoPE scaling 设错让长上下文输出乱掉

本地模型处理超过原生上下文长度的输入时输出开始乱码、重复或完全随机。RoPE scaling 参数配置错误是主因,给出正确参数对照和验证方法。

2026/05/25 #local-llm #llama-cpp
常见问题解决库

Tokenizer 版本不一致导致 token 计数对不上

本地模型的 token 计数与 API 端不一致,导致截断位置错误或上下文溢出。从 tokenizer 版本管理、GGUF 内嵌 tokenizer 与外部库的差异给出对齐方案。

2026/05/25 #local-llm #llama-cpp
AI AI 工具指南

专注 AI 工具与数字效率的中文 / 英文双语内容站。

导航

  • AI 工具教程
  • AI 场景化应用
  • AI 提示词库
  • 独立开发 / 建站指南
  • 常见问题解决库

法律

  • 关于本站
  • 联系我们
  • 隐私政策
  • 服务条款
  • 免责声明
  • 编辑政策与 AI 声明
  • 联盟链接披露
  • RSS 订阅
© 2026 AI 工具指南. 保留所有权利。

本站使用 cookies 来分析访问情况并展示个性化广告。点击「同意」即表示你接受 cookies 的使用;你也可以选择「拒绝」,仅保留必要的功能性 cookies。 隐私政策