VPS chạy n8n / AI agent 24/7: chọn cấu hình thế nào

Chia sẻ bài viết

Mục lục

VPS chạy n8n hay AI agent 24/7 cần cấu hình khác hẳn VPS web thông thường. Bài này giúp bạn xác định đúng số RAM, CPU, ổ cứng - và tránh mua thừa hoặc thiếu khi triển khai workflow tự động.

n8n và AI agent cần gì từ VPS?

n8n là nền tảng workflow automation mã nguồn mở, chạy như một Node.js process thường trú. AI agent (LangChain, AutoGen, CrewAI...) tiêu tốn RAM khi load model context và xử lý response. Điểm khác biệt so với web app:

  • RAM không thể swap: Khi workflow trigger, n8n nạp toàn bộ node vào RAM. Swap sẽ gây timeout.
  • CPU burst ngắn: Mỗi execution chỉ cần CPU trong vài giây, nhưng cần burst nhanh - không phù hợp CPU throttled.
  • I/O thấp hơn web: n8n lưu execution log vào SQLite hoặc PostgreSQL, không cần IOPS cao như database server.
  • Uptime 24/7: Khác dev machine, VPS cần chạy liên tục không restart.

Mức cấu hình theo quy mô workflow

Quy mô RAM vCPU Storage Use case
Cá nhân / test 2 GB 1-2 20 GB SSD 5-10 workflow, trigger dưới 50 lần/ngày
Freelancer / nhóm nhỏ 4 GB 2 40 GB SSD 20-50 workflow, webhook liên tục
Doanh nghiệp nhỏ 8 GB 4 80 GB NVMe 100+ workflow, AI node, queue mode
AI agent nặng 16 GB+ 8 100 GB NVMe Local embedding, multi-agent, LLM proxy

Tại sao RAM là yếu tố quyết định?

n8n queue mode cần ít nhất 1.5 GB RAM cho main process + worker. Nếu thêm AI node gọi embedding local (Ollama + nomic-embed-text), mỗi request embed tốn 300-500 MB. VPS 2 GB sẽ OOM kill process khi chạy song song.

Rule of thumb: n8n cơ bản = 2 GB RAM; mỗi AI agent thêm = cộng thêm 2-4 GB tùy model size.

NVMe vs SSD thường: cần thiết không?

Với n8n thuần (không local LLM), SSD SATA 500 MB/s là đủ. Trường hợp cần NVMe:

  • Chạy Ollama với model llama3-8B trở lên: load model từ disk mỗi lần cold start tốn 3-8s trên SSD, dưới 1s trên NVMe.
  • Vector database (Qdrant, Chroma) với tập dữ liệu trên 10 GB.
  • PostgreSQL execution log với workflow trên 1000 execution/ngày.

Cài n8n trên VPS: các bước cụ thể

Option 1: Docker Compose (khuyến nghị)

# Cài Docker
curl -fsSL https://get.docker.com | sh

# Tạo thư mục và file docker-compose.yml
mkdir -p /opt/n8n && cd /opt/n8n

# Nội dung docker-compose.yml
version: "3.8"
services:
  n8n:
    image: n8nio/n8n
    restart: always
    ports:
      - "5678:5678"
    environment:
      - N8N_BASIC_AUTH_ACTIVE=true
      - WEBHOOK_URL=https://n8n.yourdomain.com
      - GENERIC_TIMEZONE=Asia/Ho_Chi_Minh
    volumes:
      - n8n_data:/home/node/.n8n
volumes:
  n8n_data:

docker compose up -d

Option 2: Queue mode cho volume cao

services:
  redis:
    image: redis:7-alpine
    restart: always
  n8n:
    environment:
      - EXECUTIONS_MODE=queue
      - QUEUE_BULL_REDIS_HOST=redis
  n8n-worker:
    image: n8nio/n8n
    command: worker

Chạy ổn định 24/7: các điểm cần kiểm tra

  • Reverse proxy Nginx + SSL: Không expose port 5678 trực tiếp; dùng Nginx proxy_pass + Let's Encrypt.
  • Monitoring: Cài Uptime Kuma cùng VPS, alert Telegram khi n8n down.
  • Backup execution DB: Nếu dùng SQLite, backup file mỗi ngày.
  • RAM swap: Thêm 2 GB swap file để cushion OOM, không phụ thuộc swap cho performance.

AI Agent 24/7: kiến trúc tham khảo

  • n8n (trigger + orchestrator): 2 GB RAM, nhận webhook/cron, gọi API ngoài.
  • Ollama (local LLM): 8-16 GB RAM tùy model; llama3.2:3b chạy được trên 4 GB; llama3.1:8b cần 8 GB.
  • Qdrant (vector DB): 1-2 GB RAM cho tập dưới 100k document.
  • Tổng tối thiểu: VPS 16 GB RAM nếu muốn chạy cả 3 trên cùng server.

Nếu gọi LLM qua API (OpenAI, Anthropic, Gemini), VPS 4 GB là đủ cho n8n + agent framework - không cần RAM cho local model.

FAQ

VPS 2 GB RAM có chạy n8n được không?

Được, nhưng giới hạn. n8n chạy ổn với workflow đơn giản (gọi API, xử lý JSON). Khi workflow phức tạp hơn hoặc thêm AI node, 2 GB sẽ bị tight. Nếu budget hạn chế, bắt đầu 2 GB rồi nâng lên 4 GB khi cần.

n8n có thể tự restart khi VPS reboot không?

Có - đó là lý do dùng restart: always trong Docker Compose. Ngoài ra chạy thêm docker update --restart always n8n để chắc chắn.

Nên chọn VPS ở đâu để latency thấp với Việt Nam?

Region Singapore hoặc Hong Kong có latency 15-40ms từ HCM. Nếu workflow chủ yếu gọi API quốc tế (OpenAI, Google), region ảnh hưởng ít - nhưng nếu có user nội địa tương tác, chọn server gần hơn.

n8n cloud vs self-hosted VPS: nên chọn gì?

n8n cloud ($24+/tháng) không giới hạn execution nhưng tốn tiền theo quy mô. Self-hosted VPS (~$10-20/tháng) phù hợp khi có kỹ thuật, muốn full control, chạy AI node nội bộ, hoặc xử lý dữ liệu nhạy cảm.

Cần VPS chạy n8n ổn định 24/7?

TND cung cấp VPS n8n chuyên dụng - cấu hình tối ưu, hỗ trợ cài đặt, tư vấn workflow miễn phí. Xem thêm bảng giá VPS và chọn gói phù hợp.

Xem VPS n8n chuyên dụng