Vram - DEV Community

👋 Sign in for the ability to sort posts by relevant, latest, or top.

Jovan Chan

Jun 11

Qwen 3.6 35B-A3B for Local AI in 2026: The 24GB VRAM Line That Gets You 120 tok/s

#qwen #localllm #gpu #vram

6 min read

Patrick Hughes

Jun 9

How to Tune llama.cpp --n-gpu-layers: A Practical VRAM Guide (2026)

#localllm #llamacpp #gpu #vram

3 min read

Patrick Hughes

Jun 8

How to Tune --n-gpu-layers for Your VRAM Budget

#localllm #llamacpp #gpu #vram

4 min read

Kunal

Jun 7

Local LLM Hardware Requirements in 2026: What You Actually Need for Every Model Tier [Guide]

#localllm #hardware #vram #gpu

8 min read

Jovan Chan

Jun 2

Best Local AI Models for Each VRAM Tier (4 GB to 80 GB) in 2026

#localai #vram #hardware #gpu

6 min read

Thurmon Demich

May 15

Best GPU for Llama 70B in 2026 (48GB+ VRAM Required)

#gpu #llama #70b #vram

6 min read

plasmon

Apr 14

VRAMを増やせば解決する、は物理的に間違っている — HBM・CXL・Unified Memoryが取れなかったもの

#llm #gpu #vram

4 min read

plasmon

Apr 8

Q4 KV Cache Fit 32K Context into 8GB VRAM — Only Math Broke

#llm #quantization #vram #localllm

8 min read

Yaroslav Pristupa

Apr 6

I built a duty-cycle throttler for my RTX 4060 (because undervolting wasn't enough)

#softwaredevelopment #gpu #vram #hardware

4 min read

Umair Bilal

Mar 19

Unleash Large AI Models: Extend GPU VRAM with System RAM (Nvidia Greenboost)

#nvidia #gpu #vram #ai

17 min read

Alan West

Mar 25

Cloud LLMs vs Local Models: Can 32GB of VRAM Actually Compete with Claude Opus?

#localllm #claudeopus #ollama #vram

4 min read

👋 Sign in for the ability to sort posts by relevant, latest, or top.