Hermes AI Agent: cài đặt trên VPS + gắn proxy chạy automation ổn định

Mục lục

Hermes AI Agent của Nous Research ra mắt tháng 2/2026 và nhanh chóng trở thành lựa chọn yêu thích của dân tự động hóa: một agent AI sống trên server của bạn, có bộ nhớ bền vững, càng chạy lâu càng giỏi. Nhưng nếu bạn định dùng nó để làm web automation - scrape, điền form, theo dõi web - thì có một mảnh ghép quan trọng hay bị bỏ quên: proxy. Bài này hướng dẫn cài Hermes trên VPS và giải thích vì sao gắn proxy IPv4 dedicated lại quyết định việc agent của bạn chạy ổn định hay bị chặn sau vài ngày.

Hermes AI Agent là gì?

Hermes Agent là agent AI tự cải tiến (self-improving), mã nguồn mở, do Nous Research phát triển, repo tại github.com/NousResearch/hermes-agent. Câu mô tả của họ ngắn gọn: "The agent that grows with you" - agent lớn lên cùng bạn.

Điểm cốt lõi khiến Hermes khác biệt là hệ thống bộ nhớ ba lớp:

  • Skill memory - nó tự tạo kỹ năng từ trải nghiệm và cải thiện kỹ năng đó trong lúc dùng
  • Conversational memory - tìm lại được trong chính các hội thoại cũ của nó
  • User modeling - hiểu dần thói quen của bạn

Hệ quả thực tế: với những việc lặp đi lặp lại, Hermes giỏi hơn theo thời gian một cách đo lường được. Đây không phải agent "chạy một lần rồi quên".

Hermes làm được gì?

  • Tìm kiếm web, trích xuất nội dung trang
  • Browser automation đầy đủ: điều hướng, click, gõ text, chụp màn hình
  • Phân tích hình ảnh (vision), sinh ảnh, text-to-speech, suy luận đa mô hình
  • Lập lịch tự động qua cron tích hợp
  • Spawn subagent để chạy song song nhiều luồng việc
  • Gateway nối Telegram, Discord, Slack, WhatsApp, Signal và CLI vào một tiến trình duy nhất

Toàn bộ dữ liệu nằm trên máy bạn - không telemetry, không tracking, không cloud lock-in. Đúng tinh thần self-host.

Hermes cần VPS cỡ nào?

README chính thức không liệt kê con số RAM/CPU cứng, nhưng tài liệu triển khai và thực tế cộng đồng cho một mốc rõ ràng: VPS 8GB RAM, có Docker là cấu hình hợp lý cho production, đặc biệt nếu bạn bật browser automation (Chromium ăn RAM rất khỏe).

Nhu cầu Cấu hình gợi ý Ghi chú
Thử nghiệm, agent CLI nhẹ 2-4GB RAM Chạy được TUI và gateway chat cơ bản, chưa nên bật browser nặng
Production + browser automation 6-8GB RAM, 2+ vCPU Chromium headless + vision + nhiều kênh chạy song song cần RAM thật
💡 Mẹo: Nếu chỉ chạy agent chat + cron đơn giản, VPS 50 của TND (4 vCPU/4GB) là đủ vào. Khi bật browser automation thật sự, lên VPS 80 (6 vCPU/6GB/80GB) để Chromium không bóp nghẹt RAM. RAM ECC của TND giảm rủi ro lỗi bit khi agent chạy liên tục nhiều ngày.

Cài đặt Hermes trên VPS

Bước 1: VPS sạch + Docker

Khởi tạo VPS Ubuntu, SSH vào, cài Docker (Hermes nói rõ là chạy tốt trên VPS có Docker):

sudo apt update && sudo apt upgrade -y
curl -fsSL https://get.docker.com | sudo sh
sudo usermod -aG docker $USER
# logout/login lại để áp dụng quyền docker

Bước 2: Cài Hermes bằng một lệnh

Hermes hỗ trợ Linux/macOS/WSL2/Termux, cài tất cả tự động qua một lệnh curl (lệnh này lấy từ README chính thức):

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
⚠️ Lưu ý: "curl pipe bash" tiện nhưng là chạy script lạ với quyền user của bạn. Nên đọc qua script trước khi chạy (curl ... -o install.sh rồi xem nội dung), nhất là trên server có dữ liệu quan trọng.

Muốn setup kiểu developer thì clone repo:

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
./setup-hermes.sh

Bước 3: Chọn LLM provider

Chạy lệnh sau để chọn nhà cung cấp model:

hermes model

Hermes hỗ trợ rất nhiều nguồn: Nous Portal, OpenRouter (200+ model), NovitaAI, NVIDIA NIM, z.ai/GLM, Kimi/Moonshot, MiniMax, Hugging Face, OpenAI, hoặc endpoint riêng của bạn. Với Nous Portal có thể dùng:

hermes setup --portal

Bước 4: Chạy

hermes              # CLI tương tác (TUI)
hermes gateway      # bật gateway nối các kênh chat
hermes setup        # chạy lại wizard cấu hình đầy đủ

Vì sao phải gắn proxy cho Hermes khi làm web automation?

Đây là phần mà 90% hướng dẫn bỏ qua, và cũng là phần khiến agent của bạn chết âm thầm sau vài ngày.

Khi Hermes làm browser automation hoặc scrape, mọi request đi ra từ IP của VPS. Vấn đề: IP datacenter (chính là IP mặc định của hầu hết VPS) đã bị các hệ thống chống lạm dụng của Cloudflare, Google, Meta gắn cờ sẵn. Hậu quả điển hình:

  • Ngày 1: scrape ngon lành
  • Ngày 14: bắt đầu trả về 429 (Too Many Requests)
  • Sau đó: 403 Forbidden vĩnh viễn, hoặc CAPTCHA tường lửa mọi lúc

Lặp lại request từ cùng một IP sẽ kích hoạt chặn ở mức IP trên target. Agent của bạn vẫn chạy, vẫn tốn tiền LLM, nhưng dữ liệu trả về toàn rỗng hoặc trang chặn.

Giải pháp: route traffic của Hermes qua proxy IPv4 riêng

Hermes có sẵn cơ chế cấu hình proxy. Module scrape (Scrapling) nhận tham số proxy trực tiếp, ví dụ:

proxy='http://user:pass@proxy_ip:8080'

Còn ở tầng hệ thống, bạn có thể export biến môi trường để mọi traffic outbound (curl, browser, scrape) đi qua proxy:

export HTTP_PROXY="http://user:pass@proxy_ip:8080"
export HTTPS_PROXY="http://user:pass@proxy_ip:8080"

Quan trọng là loại proxy bạn dùng. Proxy IPv4 dedicated (IP riêng, không chia sẻ với người khác) thắng proxy share ở mấy điểm:

Tiêu chí IP datacenter mặc định của VPS Proxy IPv4 dedicated
Tỷ lệ bị chặn Cao - IP đã bị gắn cờ sẵn Thấp hơn nhiều - IP sạch, riêng bạn dùng
Reputation Dùng chung với hàng trăm VPS khác, dễ "vạ lây" Một mình một IP, bạn kiểm soát hành vi
Phù hợp nuôi account Kém - dễ flag Tốt - IP cố định ổn định cho automation/account
💡 Mẹo: TND có bán Proxy IPv4 fresh, dedicated, cả IP Việt Nam lẫn IP US - đúng loại để nuôi account và chạy automation. Pattern hợp lý: VPS đặt agent + Hermes, traffic web automation route qua proxy dedicated. Mỗi luồng việc nhạy cảm (mỗi account, mỗi target) dùng một IP riêng để không "dính chùm" khi một IP bị chặn.

Khi nào cần IP residential thay vì datacenter?

Với những target khó tính nhất (mạng xã hội lớn, các trang chống bot mạnh), IP datacenter bị gắn cờ trước nên đôi khi cần IP residential. Tài liệu Hermes cũng hỗ trợ residential proxy (ví dụ qua Browserbase với BROWSERBASE_PROXIES=true). Còn với phần lớn việc scrape/automation thông thường, một proxy IPv4 dedicated sạch là quá đủ và rẻ hơn nhiều so với residential tính theo GB.

VN proxy hay US proxy? Chọn theo target

TND bán cả proxy IPv4 IP Việt Nam lẫn IP US, và chọn loại nào không phải tùy hứng - nó phụ thuộc vào trang bạn nhắm tới:

  • Target là dịch vụ/website Việt Nam (sàn TMĐT VN, trang tin VN, dịch vụ nội địa): dùng proxy IP Việt Nam. IP VN truy cập trang VN trông tự nhiên, ít bị nghi ngờ "traffic lạ từ nước ngoài", và độ trễ thấp.
  • Target là dịch vụ quốc tế (trang US, công cụ chỉ phục vụ thị trường Mỹ, hoặc cần geo US): dùng proxy IP US. Nhiều dịch vụ chặn hoặc giới hạn theo vùng, IP US mở được nội dung mà IP VN không thấy.

Nguyên tắc chung: IP của proxy nên khớp với "vùng" mà target mong đợi người dùng thật đến từ đó. Một con agent scrape trang Mỹ bằng IP datacenter nước ngoài lạ hoắc là cờ đỏ ngay lập tức.

Một IP một việc: tránh dính chùm

Lỗi nguy hiểm nhất khi automation là dồn nhiều account/nhiều luồng việc vào cùng một IP. Khi một việc bị flag, IP đó bị chặn, và mọi account khác đi chung IP cũng "chết" theo. Với proxy IPv4 dedicated, mỗi luồng nhạy cảm nên được gán một IP riêng. Hermes hỗ trợ truyền proxy riêng cho từng tác vụ scrape (qua tham số proxy= của Scrapling), nên bạn hoàn toàn có thể thiết kế kiểu mỗi subagent dùng một IP.

💡 Mẹo: Hermes có thể spawn nhiều subagent chạy song song. Nếu mỗi subagent xử lý một account/target khác nhau, hãy gán mỗi subagent một proxy IPv4 dedicated riêng. Cách này biến điểm yếu (nhiều luồng = nhiều rủi ro chặn) thành điểm mạnh (cô lập rủi ro, một IP chết không kéo theo IP khác).

Kiến trúc gợi ý: VPS + Hermes + Proxy

[ Bạn / Telegram, Discord ]
            |
            v
   [ VPS TND - Ubuntu ]
   ├── Hermes Agent (Docker)
   ├── Chromium sidecar (browser automation)
   └── outbound traffic --> [ Proxy IPv4 dedicated (VN/US) ] --> Internet

Toàn bộ "bộ não" (agent, memory, LLM call) nằm trên VPS; toàn bộ "khuôn mặt ra ngoài Internet" đi qua proxy. Khi một IP bị chặn, bạn chỉ cần đổi proxy chứ không phải dựng lại cả agent.

Muốn xem bức tranh tổng thể về dựng hạ tầng tự động hóa AI trên VPS, đọc thêm bài tổng hợp VPS cho vibe coder của bọn mình.

Tổng kết

Hermes AI Agent là một con agent self-host xịn: bộ nhớ ba lớp, càng dùng càng giỏi, cài bằng một lệnh curl. Nhưng nếu bạn dùng nó cho web automation mà bỏ qua proxy, agent sẽ chết âm thầm vì IP datacenter bị chặn. Công thức ổn định: VPS 6-8GB RAM cho production + proxy IPv4 dedicated route traffic ra ngoài. Tách não (VPS) khỏi mặt (proxy IP) để mỗi khi bị chặn chỉ đổi IP, không phải dựng lại từ đầu.

Dựng Hermes ổn định: VPS khỏe + Proxy IPv4 sạch

Cloud VPS SSD TND (RAM ECC, Ceph SSD NVMe, khởi tạo 60 giây) để chạy agent, cộng Proxy IPv4 dedicated VN/US fresh để traffic automation không bị gắn cờ. Combo chuẩn cho dân tự động hóa.

Xem bảng giá VPS

Chia sẻ bài viết