Tags
1 个页面
GPU调优
8G 显存跑 llama.cpp 怎么调:32K 更稳,64K 要开 KV Cache 量化