每次本地大模型发布新引擎,评论区都会分成两派:一派兴奋地晒出速度对比,另一派担心量化会不会悄悄拉低回答质量。这次Ollama把MLX引擎推给我时,我原本也只打算测一测生成速度,结果却被一个更隐蔽的变化抓住了注 ...