本地跑 LLM 的痛点和云端完全不同:模型下载到一半挂、GPU 探测不到、显存 OOM、量化版本掉智商、chat template 不匹配导致输出乱码、tool calling 模型不理你的 JSON schema。 这个 Hub 覆盖最常见的几个运行时:Ollama、LM Studio、llama.cpp、vLLM、MLX。每篇文章只解决一种症状——"我换了模型为什么变笨"、"为什么 GPU 一直没被用上"、"为什么 ollama list 看不到我刚 pull 的模型"。 不重复"怎么装 Ollama"那种入门内容;直接讲故障点 + 最短修法 + 验证清单。

常见问题