llmkube

面向 llama.cpp 原生 LLM 推理的 Kubernetes Operator,支持 GPU 调度、Apple Silicon Metal 加速及兼容 OpenAI 的 API。

Hot Questions