GPU VPS · NVIDIA RTX · AI training · ML inference

GPU VPS NVIDIA RTX
cho AI + ML training.

VPS GPU dedicated NVIDIA L4 / RTX 3060 / RTX 4090 / A6000 — chạy LLM inference, train model, render Blender, mine ETH classic. CUDA + PyTorch + TensorFlow pre-installed.

NVIDIAL4 · 3060 · 4090 · A6000
CUDA 12PyTorch + TF
60sDeploy tự động
24/7Tech support
$ nvidia-smi
NVIDIA RTX 4090 24GB
Driver 550.90 + CUDA 12.4
PyTorch 2.5 + cuDNN 9
$ python -c "import torch; print(torch.cuda.is_available())"
→ True
Ollama loaded: llama 3.3 70B
Throughput: 45 tok/s
Ready
NVIDIA RTXLatest GPU dedicated
CUDA 12.4PyTorch + cuDNN
PCIe 4.0Direct passthrough
NVMe enterpriseFast model loading
Bảng giá GPU VPS

4 gói GPU — chọn theo workload

GPU dedicated passthrough (không share), CUDA + PyTorch + Ollama pre-installed, đủ cho LLM inference, image gen, training.

Inference

GPU L4

Inference small LLM · API serving
999Kđ/tháng
  • ✓ NVIDIA L4 24GB
  • ✓ 4 CPU · 16GB RAM
  • ✓ 100GB NVMe
  • ✓ CUDA 12.4 + PyTorch
  • ✓ Ollama + vLLM ready
Đặt ngay
Phổ biến Indie dev

GPU 3060

Stable Diffusion · Llama 7B
2.5Mđ/tháng
  • ✓ RTX 3060 12GB
  • ✓ 6 CPU · 32GB RAM
  • ✓ 200GB NVMe
  • ✓ Jupyter Lab + ComfyUI
  • ✓ Pre-trained models
Đặt ngay
Pro

GPU 4090

LLM 70B · Image gen scale
5Mđ/tháng
  • ✓ RTX 4090 24GB
  • ✓ 8 CPU · 64GB RAM
  • ✓ 500GB NVMe
  • ✓ vLLM serving
  • ✓ Multi-tenant possible
Đặt ngay
Enterprise

GPU A6000

Training · Production AI
12Mđ/tháng
  • ✓ RTX A6000 48GB
  • ✓ 16 CPU · 128GB RAM
  • ✓ 1TB NVMe
  • ✓ NVLink option
  • ✓ Dedicated rack
Đặt ngay
Tính năng

9 ưu thế GPU VPS TND

GPU passthrough thuần

GPU pin riêng cho 1 VM, không share. PCIe 4.0 trực tiếp, không có overhead virtualization.

CUDA 12.4 + PyTorch 2.5

Stack ML pre-installed: CUDA, cuDNN, PyTorch, TensorFlow, JAX. Conda env quick switch.

Ollama + vLLM ready

Serve Llama 3.3 70B, Mistral, Qwen 2.5 qua REST API. Auto-load model khi VM boot.

NVMe enterprise

Fast model loading — Llama 70B (140GB) load trong 90s vs 8 phút trên SATA.

Jupyter Lab + VS Code

Browser IDE access — code Python/notebook ngay không cần SSH local.

ComfyUI + Stable Diffusion

Pre-configured cho image gen: SDXL, Flux, SD 3.5 + LoRA loader.

Network isolated

GPU VPS có subnet riêng + firewall — không share VLAN với VPS thường.

SLA 99.5%

GPU dedicated production-grade. Replace GPU trong 4h nếu hardware fail.

API quản lý

REST API: snapshot model, restart, monitor GPU usage realtime, billing per hour option.

FAQ

Câu hỏi thường gặp

Có dùng cho training model lớn không?

GPU L4 + 3060 cho fine-tune model 7B. RTX 4090 đủ train LoRA cho 13B. A6000 (48GB) train full model 30B. Lớn hơn cần multi-GPU — liên hệ Enterprise.

Có billing per hour không?

Có. Stop VM khi không dùng → tính theo giờ. Default monthly bill, switch hourly qua dashboard.

GPU mới (H100, B200) có không?

Hiện tại: L4, 3060, 4090, A6000. H100/B200 PCIe theo yêu cầu (lead time 2-4 tuần) — liên hệ Enterprise.

Hỗ trợ Linux + Windows GPU?

Linux native (Ubuntu/Debian). Windows GPU yêu cầu license riêng — additional fee.

Backup model file?

NVMe drive có snapshot daily. Model file lưu /home/models/ snapshot tự động. Storage thêm: 200k/100GB/tháng.

Dùng để mining crypto?

Không khuyến nghị — TND không cung cấp hỗ trợ mining. ROI thấp với điện VN. Chuyên cho AI/ML inference.

GPU VPS chỉ từ 999.000đ/tháng

GPU L4 — NVIDIA L4 24GB + 16GB RAM. Đủ inference LLM 7B + image gen Flux.

Đặt ngay