Back to RunThisModel

AI Models You Can Run with 6GB VRAM

103 models compatible across 9 categories

Compatible Models

103

Largest Model

Gemma 2 9B Instruct (9.2B)

Categories

9

4GB 6GB 8GB 10GB 12GB 16GB 20GB 24GB 32GB 48GB 64GB 80GB 128GB 192GB

💬

Chat / LLM (45 models)

Gemma 2 9B Instruct

Google

5.9GB VRAMQ4_K_M

Yi 1.5 9B Chat

01.AI

5.5GB VRAMQ4_K_M

DeepSeek R1 Distill 8B

DeepSeek

5.8GB VRAMQ5_K_M

Llama 3.1 8B Instruct

Meta

5.8GB VRAMQ5_K_M

Granite 3.3 8B

IBM

5.1GB VRAMQ4_K_M

Dolphin 3.0 Llama 3.1 8B

Cognitive Computations

5.1GB VRAMQ4_K_M

NeuralDaredevil 8B (abliterated)

mlabonne

5.1GB VRAMQ4_K_M

Llama 3.1 8B Instruct (abliterated)

mlabonne

5.1GB VRAMQ4_K_M

Stheno L3 8B v3.2

Sao10K

5.1GB VRAMQ4_K_M

Qwen3 8B Base

Alibaba

5.3GB VRAMQ4_K_M

EXAONE 3.5 7.8B

LG AI

4.9GB VRAMQ4_K_M

InternLM 2.5 7B

Shanghai AI Lab

4.9GB VRAMQ4_K_M

Qwen 2.5 7B Instruct

Alibaba

5.3GB VRAMQ4_K_M

Mistral 7B Instruct v0.3

Mistral AI

5.3GB VRAMQ5_K_M

Falcon 3 7B

TII

5.0GB VRAMQ4_K_M

OLMo 2 7B

Allen AI

4.7GB VRAMQ4_K_M

OpenChat 3.5 7B

OpenChat

4.6GB VRAMQ4_K_M

OLMoE 1B-7B

AI2

4.4GB VRAMQ4_K_M

Yi 1.5 6B Chat

01.AI

3.9GB VRAMQ4_K_M

Gemma 3 4B

Google

Nemotron Mini 4B

NVIDIA

Danube 3 4B

H2O.ai

Phi-3.5 Mini 3.8B

Microsoft

Phi-4 Mini 3.8B

Microsoft

Granite 3.0 3B-A800M

IBM

2.4GB VRAMQ4_K_M

Llama 3.2 3B Instruct

Meta

Qwen 2.5 3B

Alibaba

Falcon 3 3B

TII

StableLM Zephyr 3B

Stability AI

Rocket 3B

Pansophic

Gemma 2 2B

Google

EXAONE 3.5 2.4B

LG AI

Granite 3.3 2B

IBM

SmolLM2 1.7B

HuggingFace

Qwen 2.5 1.5B

Alibaba

DeepSeek R1 Distill 1.5B

DeepSeek

Granite 3.0 1B-A400M

IBM

1.3GB VRAMQ4_K_M

Llama 3.2 1B Instruct

Meta

TinyLlama 1.1B

TinyLlama

Gemma 3 1B

Google

Falcon 3 1B

TII

Qwen 2.5 0.5B

Alibaba

Danube 3 500M

H2O.ai

SmolLM2 360M

HuggingFace

SmolLM2 135M

HuggingFace

💻

Coding (14 models)

Yi Coder 9B

01.AI

5.5GB VRAMQ4_K_M

CodeGemma 7B

Google

5.5GB VRAMQ4_K_M

Qwen 2.5 Coder 7B

Alibaba

4.9GB VRAMQ4_K_M

StarCoder2 7B

BigCode

4.7GB VRAMQ4_K_M

Code Llama 7B

Meta

4.3GB VRAMQ4_K_M

DeepSeek Coder 6.7B

DeepSeek

4.3GB VRAMQ4_K_M

Qwen 2.5 Coder 3B

Alibaba

StarCoder2 3B

BigCode

Stable Code 3B

Stability AI

CodeGemma 2B

Google

Qwen 2.5 Coder 1.5B

Alibaba

Yi Coder 1.5B

01.AI

DeepSeek Coder 1.3B

DeepSeek

Qwen 2.5 Coder 0.5B

Alibaba

👁

Multimodal (6 models)

LLaVA 1.6 7B

LLaVA

5.0GB VRAMQ4_K_M

Phi-3.5 Vision

Microsoft

3.2GB VRAMQ4_K_M

PaliGemma 3B

Google

2.5GB VRAMQ4_K_M

Qwen2-VL 2B

Alibaba

MiniCPM-V 2.6

OpenBMB

Moondream 2

Moondream

1.5GB VRAMQ4_K_M

🎨

Image Generation (6 models)

Stable Diffusion XL (CoreML)

Stability AI

3.3GB VRAMCoreML

SDXL Turbo (GGUF)

Stability AI

Stable Diffusion 2.1 Base (CoreML)

Stability AI / Apple

1.6GB VRAMCoreML-Palettized

Stable Diffusion 1.5 (CoreML)

Runway

2.5GB VRAMCoreML-Palettized

Stable Diffusion 1.5 (GGUF)

Runway / GPUStack

Stable Diffusion 2.1 (GGUF)

Stability AI

🎤

Speech Recognition (9 models)

Whisper Large v3

OpenAI

Whisper Large v3 Turbo

OpenAI

Whisper Medium

OpenAI

Distil-Whisper Large v3

HuggingFace

Whisper Small

OpenAI

Whisper Base

OpenAI

Whisper Base English

OpenAI

Whisper Tiny English (Quantized)

OpenAI

Whisper Tiny

OpenAI

🔊

Text to Speech (14 models)

Kokoro 82M TTS

Kokoro

0.6GB VRAMONNX-Q8F16

Piper TTS - Amy (English)

Rhasspy

Piper TTS - Lessac (English)

Rhasspy

Piper TTS - LibriTTS-R (English)

Rhasspy

Piper TTS - Spanish (MLS)

Rhasspy

Piper TTS - French (Siwis)

Rhasspy

Piper TTS - German (Thorsten)

Rhasspy

Piper TTS - Chinese (Huayan)

Rhasspy

Piper TTS - Japanese (Kokoro)

Rhasspy

Piper TTS - Korean

Rhasspy

Piper TTS - Russian (Irina)

Rhasspy

Piper TTS - Portuguese (Faber)

Rhasspy

Piper TTS - Italian (Riccardo)

Rhasspy

Piper TTS - Arabic (Kareem)

Rhasspy

🎵

Audio Generation (2 models)

Stable Audio Open

Stability AI

MusicGen Small

Meta

0.8GB VRAMONNX-Q4F16

🧩

Embedding (5 models)

BGE Large EN v1.5

BAAI

Nomic Embed Text v1.5

Nomic AI

BGE Small EN v1.5

BAAI

Snowflake Arctic Embed S

Snowflake

all-MiniLM-L6-v2

Sentence Transformers

🔄

Reranker (2 models)

BGE Reranker v2 M3

BAAI

Jina Reranker Tiny EN

Jina AI

Compatible GPUs (96 with 6GB+ VRAM)

NVIDIA RTX 3060 Laptop

NVIDIA GeForce GTX 1660

NVIDIA GeForce GTX 1660 SUPER

NVIDIA GeForce GTX 1060 6GB

NVIDIA GeForce GTX 1660 Ti

NVIDIA GeForce RTX 2060

NVIDIA RTX 4070 Laptop

NVIDIA RTX 4060 Laptop

NVIDIA RTX 3070 Laptop

Apple Silicon (Unknown)

Intel Arc A580

NVIDIA GeForce RTX 3050

AMD Radeon RX 7600

Intel Arc A750

NVIDIA GeForce RTX 5060

NVIDIA GeForce RTX 4060

AMD Radeon RX 6600

NVIDIA GeForce GTX 1070

AMD Radeon RX 6600 XT

NVIDIA GeForce RTX 4060 Ti

NVIDIA GeForce RTX 3060 Ti

NVIDIA GeForce RTX 2060 SUPER

NVIDIA GeForce GTX 1070 Ti

NVIDIA GeForce RTX 3070

NVIDIA GeForce RTX 2070 SUPER

NVIDIA GeForce RTX 2070

NVIDIA GeForce RTX 3070 Ti

NVIDIA GeForce GTX 1080

NVIDIA GeForce RTX 2080 SUPER

NVIDIA GeForce RTX 2080

Intel Arc B570

NVIDIA GeForce RTX 3080

NVIDIA GeForce GTX 1080 Ti

NVIDIA GeForce RTX 2080 Ti

11GB$1,199nvidia

NVIDIA RTX 4080 Laptop

Intel Arc B580

NVIDIA GeForce RTX 3060 12GB

AMD Radeon RX 7700 XT

AMD Radeon RX 6700 XT

NVIDIA GeForce RTX 5070

NVIDIA GeForce RTX 4070 SUPER

NVIDIA GeForce RTX 4070

NVIDIA GeForce RTX 4070 Ti

NVIDIA GeForce RTX 3080 Ti

12GB$1,199nvidia

NVIDIA RTX 4090 Laptop

NVIDIA RTX 3080 Laptop

Apple M1

AMD Radeon RX 7600 XT

Intel Arc A770

NVIDIA GeForce RTX 5060 Ti

AMD Radeon RX 9070

NVIDIA GeForce RTX 4060 Ti 16GB

AMD Radeon RX 7800 XT

AMD Radeon RX 9070 XT

AMD Radeon RX 7900 GRE

AMD Radeon RX 6800

AMD Radeon RX 6800 XT

NVIDIA GeForce RTX 5070 Ti

NVIDIA GeForce RTX 4070 Ti SUPER

NVIDIA GeForce RTX 5080

NVIDIA GeForce RTX 4080 SUPER

AMD Radeon RX 6900 XT

NVIDIA RTX A4000

16GB$1,000nvidia

AMD Radeon RX 6950 XT

NVIDIA GeForce RTX 4080

16GB$1,199nvidia

NVIDIA T4

16GB$2,200nvidia

AMD Radeon RX 7900 XT

Apple M3

Apple M2

AMD Radeon RX 7900 XTX

NVIDIA GeForce RTX 3090

24GB$1,499nvidia

NVIDIA GeForce RTX 4090

24GB$1,599nvidia

NVIDIA GeForce RTX 3090 Ti

24GB$1,999nvidia

NVIDIA RTX A5000

24GB$2,250nvidia

NVIDIA L4

24GB$2,500nvidia

Apple M4

Apple M2 Pro

Apple M1 Pro

NVIDIA GeForce RTX 5090

32GB$1,999nvidia

Apple M3 Pro

NVIDIA A100 40GB

40GB$10,000nvidia

Apple M4 Pro

NVIDIA RTX A6000

48GB$4,650nvidia

NVIDIA L40S

48GB$7,500nvidia

Apple M1 Max

NVIDIA A100 80GB

80GB$15,000nvidia

NVIDIA H100

80GB$30,000nvidia

Apple M2 Max

Apple M4 Max

Apple M3 Max

Apple M1 Ultra

AMD Instinct MI250X

128GB$10,000amd

Apple M4 Ultra

Apple M3 Ultra

Apple M2 Ultra

AMD Instinct MI300X

192GB$15,000amd

Frequently Asked Questions

What is the best AI model I can run with 6GB VRAM?

The largest model you can run with 6GB VRAM is Gemma 2 9B Instruct (9.2B parameters) using Q4_K_M quantization. There are 103 total compatible models.

Can I run Llama with 6GB VRAM?

Yes! You can run 7 Llama models with 6GB VRAM: Llama 3.1 8B Instruct (Q5_K_M), Dolphin 3.0 Llama 3.1 8B (Q4_K_M), Llama 3.1 8B Instruct (abliterated) (Q4_K_M), Code Llama 7B (Q4_K_M), Llama 3.2 3B Instruct (Q8_0), Llama 3.2 1B Instruct (FP16), TinyLlama 1.1B (Q8_0).

What GPU has 6GB VRAM?

GPUs with 6GB or more VRAM include: NVIDIA RTX 3060 Laptop, NVIDIA GeForce GTX 1660, NVIDIA GeForce GTX 1660 SUPER, NVIDIA GeForce GTX 1060 6GB, NVIDIA GeForce GTX 1660 Ti, and 91 more.

Other VRAM Tiers

4GB VRAM 8GB VRAM 10GB VRAM 12GB VRAM 16GB VRAM 20GB VRAM 24GB VRAM 32GB VRAM 48GB VRAM 64GB VRAM 80GB VRAM 128GB VRAM 192GB VRAM

tools:semantic search new models gguf fit check gpu benchmark leaderboard power cost multi-gpu planner finetune planner pc builder run now uncensored compare grid vram tiers

© runthismodel · 2026privacy terms disclaimer contact editorial standards changelog embed badge runpod vast.ai huggingface ollama lm-studiomade for the people who actually read GGUF metadata

 ┌─┐                ╔══╗     ╔══╗
 │░│  RUN  THIS  M  ║▓▓║ DEL ║▓▓║
 └─┘                ╚══╝     ╚══╝