VPS Ollama · Chạy LLM local trên VPS

VPS Ollama - chạy LLM mã nguồn mở ngay trên server của bạn

Ollama pre-installed sẵn trên VPS TND. Chạy Llama, Qwen, Mistral, Gemma, DeepSeek và nhiều model open source khác, gọi qua API tương thích OpenAI. Dữ liệu nằm trên VPS của bạn, không gửi ra bên thứ ba. Đăng ký dùng thử 7 ngày, hoàn tiền 30 ngày.

Xem bảng giá
Ollama là gì?

Ollama pre-installed
API tương thích OpenAI
Dữ liệu riêng tư
Hoàn tiền 30 ngày

$ ollama run llama3
pulling manifest ...
success
>>> Viết giúp một email cảm ơn khách hàng
Chào anh/chị, cảm ơn đã tin tưởng dịch vụ của chúng tôi...

$ curl http://localhost:11434/v1/chat/completions
// API tương thích OpenAI, đổi base_url là xong

Llama 3QwenMistralGemmaDeepSeekPhi

100+

Model open source

OpenAI

API tương thích

60s

Khởi tạo VPS

30 ngày

Hoàn tiền cam kết

Chạy LLM local thay vì gọi API trả phí

Tự host Ollama trên VPS để chạy AI riêng tư

Ollama là công cụ mã nguồn mở giúp chạy các model ngôn ngữ lớn ngay trên máy chủ của bạn. Bạn tải model về một lệnh, hỏi đáp qua dòng lệnh hoặc gọi qua REST API tương thích OpenAI. Không cần GPU đắt tiền, model nhỏ chạy được trên VPS RAM lớn.

Phù hợp cho dự án cần riêng tư dữ liệu, dev test prompt, hay những tác vụ nhẹ mà bạn không muốn trả phí token theo lượt gọi. Toàn quyền kiểm soát server, model và chi phí cố định mỗi tháng.

Dữ liệu không rời server

Prompt và output xử lý ngay trên VPS, không gửi ra API bên thứ ba.

API tương thích OpenAI

Đổi base_url là code cũ gọi GPT vẫn chạy, qua endpoint /v1/chat/completions.

Nhiều model open source

Llama, Qwen, Mistral, Gemma, DeepSeek, Phi tải về trong vài lệnh.

Chi phí cố định mỗi tháng

Không tính phí theo số token, chạy bao nhiêu lượt cũng một giá VPS.

Tính năng

Mọi thứ để chạy LLM local trong tầm tay

Các tính năng chính của Ollama, đã được cài sẵn và tinh chỉnh trên VPS TND.

Chạy model một lệnh

Lệnh ollama run kéo model về và chat ngay, không cần cấu hình phức tạp.

API tương thích OpenAI

Endpoint /v1/chat/completions cho phép tái sử dụng code và thư viện có sẵn.

Embeddings cho RAG

Tạo vector embeddings local để xây tìm kiếm ngữ nghĩa và RAG không gửi data ra ngoài.

Model quantized gọn nhẹ

Phiên bản quantized 3B đến 8B chạy được trên VPS RAM lớn, tiết kiệm tài nguyên.

Modelfile tùy biến

Định nghĩa system prompt, tham số và template riêng cho từng model qua Modelfile.

Kết nối n8n và Dify

Dùng làm backend LLM cho n8n, Dify, Flowise để build workflow và chatbot AI.

Bảng giá

Bảng giá VPS Ollama

Tất cả gói đã bao gồm IPv4 + IPv6, snapshot, DDoS protection và datacenter Việt Nam. Không phí ẩn - không phí khởi tạo.

Mọi gói đều cài sẵn Ollama. Sau khi đặt, chọn template Ollama trong bước cài đặt.

Cloud VPS 20

₫129k/tháng × 36

Giá gốc ~~199k~~ · tiết kiệm 35%

CPU1 socket
RAM1 GB DDR4
Lưu trữ20 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Cloud VPS 30

Khởi nghiệp

₫194k/tháng × 36

Giá gốc ~~299k~~ · tiết kiệm 35%

CPU2 socket
RAM2 GB DDR4
Lưu trữ30 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

★ Phổ biến nhất

Cloud VPS 50

₫415k/tháng × 36

Giá gốc ~~639k~~ · tiết kiệm 35%

CPU4 socket
RAM4 GB DDR4
Lưu trữ50 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Cloud VPS 80

₫649k/tháng × 36

Giá gốc ~~999k~~ · tiết kiệm 35%

CPU6 socket
RAM6 GB DDR4
Lưu trữ80 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Cloud VPS 160

SAN SSD

₫1164k/tháng × 36

Giá gốc ~~1790k~~ · tiết kiệm 35%

CPU8 socket
RAM8 GB DDR4
Lưu trữ160 GB SAN SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Cloud VPS 250

₫1424k/tháng × 36

Giá gốc ~~2190k~~ · tiết kiệm 35%

CPU10 socket
RAM10 GB DDR4
Lưu trữ250 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Cloud VPS 320

₫1814k/tháng × 36

Giá gốc ~~2790k~~ · tiết kiệm 35%

CPU12 socket
RAM12 GB DDR4
Lưu trữ320 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Cloud VPS 480

Doanh nghiệp

₫2074k/tháng × 36

Giá gốc ~~3190k~~ · tiết kiệm 35%

CPU12 socket
RAM16 GB DDR4
Lưu trữ480 GB SSD CEPH
Network200Mbps shared
IP1× IPv4 + 1× IPv6
DatacenterViệt Nam

Đăng ký ngay

Custom

Theo yêu cầu

Custom

Cấu hình linh hoạt theo nhu cầu

CPUCustom
RAMCustom
Lưu trữCustom
NetworkCustom
IPCustom
DatacenterCustom

Đăng ký ngay

Cần cấu hình lớn hơn? Liên hệ team Sales →

Vì sao chọn TND

VPS Việt Nam tối ưu cho Ollama

Stack đã được cài sẵn và tinh chỉnh để chạy model local ổn định, dễ mở rộng RAM khi cần.

Ollama pre-installed

Cài sẵn sẵn sàng, login và chạy ollama run là dùng được model ngay.

RAM lớn, SSD Ceph

Gói RAM cao giúp nạp model 7B-8B quantized, I/O nhanh khi tải trọng số.

Hỗ trợ tiếng Việt 24/7

Đội kỹ thuật giúp chọn model phù hợp RAM và cấu hình API.

Dùng thử 7 ngày

Đăng ký test free, hoàn tiền 30 ngày nếu không phù hợp.

Cùng họ VPS cài sẵn app

Khám phá các VPS cài sẵn khác của TND

TND cung cấp VPS cài sẵn ứng dụng, không phải đối tác của hãng phần mềm nào.

VPS Supabase

Backend đủ bộ Postgres, Auth, Storage, Realtime cho app của bạn.

Xem VPS Supabase

VPS Dify

Nền tảng xây app LLM, kết nối Ollama làm backend để build chatbot và RAG.

Xem VPS Dify

VPS n8n

Self-host workflow automation, build AI agent no-code với Ollama, Claude, GPT.

Xem VPS n8n

VPS OpenClaw

VPS cài sẵn cho công việc AI và tự động hóa của bạn.

Xem VPS OpenClaw

VPS Postiz

Self-host công cụ lên lịch và đăng bài social media, không giới hạn channel.

Xem VPS Postiz

VPS Flowise

Kéo thả xây AI agent và chatbot trên LangChain, dùng Ollama làm model.

Xem VPS Flowise

Bảng giá VPS

Xem toàn bộ cấu hình và giá VPS TND để chọn gói phù hợp nhu cầu.

Xem bảng giá VPS

FAQ

Câu hỏi thường gặp về VPS Ollama

Ollama là gì?

Ollama là công cụ mã nguồn mở giúp tải và chạy các model ngôn ngữ lớn open source ngay trên máy chủ của bạn. Bạn chạy model qua dòng lệnh hoặc gọi qua REST API tương thích OpenAI, không phụ thuộc dịch vụ đám mây bên ngoài.

VPS không có GPU thì chạy Ollama được không?

Được, Ollama chạy trên CPU. Các model nhỏ 3B đến 8B bản quantized chạy ổn định trên VPS RAM lớn, tốc độ chậm hơn GPU nhưng đủ dùng cho dev, test và tác vụ nhẹ. Theo hướng dẫn của Ollama, model 7B cần ít nhất 8 GB RAM và model 13B cần 16 GB RAM, nên chọn gói RAM phù hợp với kích thước model.

Nên chọn gói VPS nào cho Ollama?

Với model 3B chọn từ gói Cloud VPS 80 (6 GB RAM). Với model 7B đến 8B nên chọn gói Cloud VPS 160 (8 GB RAM) trở lên. Nếu chạy nhiều model song song hoặc context dài, chọn gói RAM cao hơn để mượt.

Ollama hỗ trợ những model nào?

Ollama hỗ trợ nhiều model open source như Llama, Qwen, Mistral, Gemma, DeepSeek, Phi và nhiều model khác trong thư viện tại ollama.com/library. Bạn cũng tải được model embeddings để xây RAG.

Ollama dùng để làm gì?

Ollama hợp với chatbot riêng tư, dev và test prompt không trả phí token, xây RAG với dữ liệu nội bộ, và làm backend LLM cho n8n, Dify hay Flowise. Vì dữ liệu nằm trên VPS của bạn nên phù hợp các dự án quan tâm quyền riêng tư.

Chạy Ollama trên VPS của riêng bạn

Ollama pre-installed, API tương thích OpenAI, dữ liệu riêng tư, dùng thử 7 ngày, hoàn tiền 30 ngày.

Xem bảng giá
Đặt VPS ngay