🍥

KnightLi Blog

记录并分享日常

Tags

14 páginas

Local LLM

Ejecutar DeepSeek 4 en local: el experimento ds4 de Antirez en Apple Silicon Mac

Cómo medir el rendimiento multi-GPU en llama.cpp: ¿2x V100 16GB son más rápidas que una sola GPU de 32GB?

Benchmarks de inferencia AI en RTX 5090 / 5080: como elegir para LLM locales, video 4K y 3D en tiempo real

Despliegue privado local de DeepSeek V4: elegir entre chips nacionales y clusters de GPU de consumo

Modelos LLM locales recomendados para una GPU RTX 3060

Hermes + Qwen3.6: una solucion barata para desplegar un Agent local

free-claude-code: conectar Claude Code a OpenRouter, DeepSeek y modelos locales mediante un proxy

Qué son los modelos en la nube de Ollama y cómo usarlos

Descargar modelos GGUF desde Hugging Face e importarlos en Ollama

Diagnóstico y soluciones para descargas muy lentas con ollama pull

Gemma 4 en Raspberry Pi 5: viable, pero con respuestas lentas

Conectar OpenClaw con Gemma 4 local: guía completa de configuración

Cómo ejecutar Gemma 4 en un portátil: guía de despliegue local en 5 minutos

Instalar y ejecutar Gemma 4 en Android: guía completa de inicio