Cara Install dan Menjalankan DeepSeek di VPS Ubuntu

Pengantar

Model AI berbasis Large Language Model (LLM) semakin banyak digunakan untuk berbagai kebutuhan, mulai dari chatbot, pembuatan konten, analisis data, hingga membantu pekerjaan pemrograman. Salah satu model AI yang saat ini banyak diperbincangkan adalah DeepSeek karena memiliki kemampuan yang cukup baik dan tersedia dalam berbagai ukuran model yang dapat dijalankan secara lokal.

Bagi pengguna VPS Ubuntu, menjalankan DeepSeek sendiri memberikan beberapa keuntungan dibandingkan menggunakan layanan AI berbasis cloud. Selain lebih fleksibel, Anda memiliki kontrol penuh terhadap data, tidak bergantung pada layanan pihak ketiga, serta dapat mengakses model kapan saja selama VPS aktif.

Pada artikel ini, Anda akan mempelajari cara install DeepSeek di VPS Ubuntu menggunakan Ollama, mulai dari persiapan server hingga menjalankan model dan melakukan pengujian pertama.

Apa Itu DeepSeek?

DeepSeek adalah model Artificial Intelligence (AI) yang dirancang untuk memahami dan menghasilkan teks layaknya manusia. Model ini tersedia dalam beberapa varian ukuran parameter sehingga dapat disesuaikan dengan spesifikasi server yang digunakan.

Beberapa kelebihan DeepSeek antara lain:

Mampu menjawab pertanyaan dengan konteks yang baik
Cocok untuk kebutuhan coding assistant
Dapat digunakan secara lokal tanpa koneksi internet setelah model diunduh
Mendukung API untuk integrasi aplikasi
Tersedia dalam berbagai ukuran model

Untuk menjalankan DeepSeek di VPS Ubuntu dengan mudah, kita akan menggunakan Ollama sebagai platform manajemen model AI.

Persiapan Sebelum Install DeepSeek

Berikut kebutuhan RAM untuk beberapa varian model DeepSeek yang umum digunakan:

DeepSeek 1.5B
RAM minimal 2 GB dan disarankan menggunakan RAM 4 GB agar performa lebih stabil.
DeepSeek 7B
RAM minimal 8 GB dan direkomendasikan menggunakan RAM 16 GB untuk mendapatkan respons yang lebih lancar.
DeepSeek 8B
RAM minimal 8 GB dan direkomendasikan menggunakan RAM 16 GB terutama jika server menjalankan aplikasi lain secara bersamaan.
DeepSeek 14B
RAM minimal 16 GB dan disarankan menggunakan RAM 32 GB untuk performa optimal.
DeepSeek 32B atau lebih besar
RAM minimal 32 GB dan direkomendasikan menggunakan RAM 64 GB atau lebih karena ukuran model yang jauh lebih besar.

Prasyarat

Sebelum melakukan instalasi dan menjalankan DeepSeek di VPS Ubuntu, pastikan beberapa kebutuhan berikut sudah tersedia:

VPS dengan sistem operasi Ubuntu 22.04 atau Ubuntu 24.04
Akses pengguna root atau user yang memiliki hak sudo
Koneksi internet yang stabil untuk mengunduh Ollama dan model DeepSeek
Minimal RAM 4 GB untuk model DeepSeek 1.5B (disarankan 8 GB atau lebih untuk model yang lebih besar)
Ruang penyimpanan (storage) yang cukup untuk menyimpan model AI
Ollama sudah terinstall dan berjalan dengan normal di VPS

Cara Download Model DeepSeek

1. Update Sistem Ubuntu

Sebelum mengunduh dan menjalankan model DeepSeek, pastikan sistem operasi telah diperbarui ke versi terbaru agar seluruh dependency dan komponen pendukung berjalan dengan optimal.

Masuk ke VPS melalui SSH kemudian jalankan:

sudo apt update

Fungsi:

Memperbarui daftar repository Ubuntu
Menginstal pembaruan package terbaru
Meningkatkan stabilitas dan keamanan sistem
Mengurangi potensi masalah kompatibilitas saat menjalankan model AI

Perintah tersebut memastikan seluruh paket sistem berada pada versi terbaru sebelum instalasi dilakukan.

Keterangan:
Apabila terdapat pembaruan kernel atau komponen penting lainnya, lakukan reboot server setelah proses update selesai.

2. Download Model DeepSeek 8B

Setelah Ollama berhasil terpasang, langkah berikutnya adalah mengunduh model DeepSeek yang ingin digunakan.

Untuk mengunduh model DeepSeek R1 8B, jalankan:

ollama pull deepseek-r1:8b

Fungsi:

Mengunduh model DeepSeek R1 8B ke server
Menyimpan model secara lokal pada sistem
Menyiapkan model agar dapat dijalankan kapan saja tanpa download ulang

Proses download dapat memakan waktu beberapa menit tergantung:

Kecepatan koneksi internet VPS
Performa storage server
Ukuran model yang diunduh

Setelah download selesai, model akan tersimpan secara permanen pada server.

Keterangan:
Model DeepSeek 8B merupakan salah satu pilihan yang populer karena mampu memberikan kualitas jawaban yang baik dengan kebutuhan resource yang masih cukup terjangkau untuk sebagian besar VPS.

3. Memverifikasi Model yang Berhasil Diunduh

Untuk melihat daftar model yang tersimpan pada server, jalankan:

ollama list

Contoh output:

NAME              SIZE
deepseek-r1:8b    4.9 GB

Penjelasan Output:

NAME
Nama model yang tersedia pada server.
SIZE
Ukuran penyimpanan yang digunakan oleh model.

Jika model muncul pada daftar tersebut, berarti proses download telah berhasil dan model siap digunakan.

Keterangan:
Model yang telah tersimpan tidak perlu diunduh ulang saat akan digunakan kembali kecuali sebelumnya dihapus dari server.

4. Download Model DeepSeek Lainnya

Selain versi 8B, Ollama juga menyediakan beberapa varian DeepSeek dengan kebutuhan resource yang berbeda.

Untuk mengunduh model lain, gunakan salah satu perintah berikut:

ollama pull deepseek-r1:1.5b

ollama pull deepseek-r1:7b

ollama pull deepseek-r1:14b

Karakteristik Masing-Masing Model:

DeepSeek R1 1.5B
Ukuran lebih kecil dan cocok untuk VPS dengan RAM terbatas.
DeepSeek R1 7B
Memberikan keseimbangan antara performa dan kebutuhan resource.
DeepSeek R1 8B
Salah satu pilihan paling populer untuk kebutuhan umum seperti chatbot, coding assistant, dan pembuatan konten.
DeepSeek R1 14B
Memiliki kemampuan reasoning yang lebih baik namun membutuhkan RAM yang lebih besar.

Pilih model sesuai kapasitas RAM dan CPU VPS yang dimiliki agar proses inferensi berjalan dengan lancar.

Keterangan:
Semakin besar ukuran model, biasanya semakin baik kualitas jawaban yang dihasilkan, namun kebutuhan RAM, CPU, dan storage juga akan meningkat secara signifikan.

Cara Menjalankan DeepSeek di VPS Ubuntu

1. Menjalankan Model DeepSeek

Setelah model berhasil diunduh ke server, Anda dapat langsung menjalankannya melalui terminal menggunakan Ollama.

Untuk menjalankan model DeepSeek R1 8B, gunakan perintah berikut:

ollama run deepseek-r1:8b

Fungsi:

Memuat model DeepSeek ke dalam memori
Menjalankan sesi interaktif AI melalui terminal
Menerima prompt dan menghasilkan respons secara langsung

Pada saat pertama kali dijalankan setelah proses download, model akan dimuat ke RAM sehingga mungkin membutuhkan beberapa saat tergantung spesifikasi VPS yang digunakan.

Jika berhasil, akan muncul prompt seperti berikut:

>>>

Keterangan:
Semakin besar ukuran model dan semakin kecil kapasitas VPS, semakin lama proses loading model ke memori.

2. Berinteraksi dengan AI

Setelah prompt muncul, Anda dapat langsung mengajukan pertanyaan atau memberikan instruksi kepada model.

Contoh:

>>> Jelaskan apa itu Ubuntu Linux

Model akan memproses pertanyaan dan memberikan jawaban secara otomatis.

Contoh respons:

Ubuntu adalah distribusi Linux berbasis Debian yang dikembangkan oleh Canonical dan dirancang untuk memberikan kemudahan penggunaan, stabilitas, serta dukungan komunitas yang luas.

Selain pertanyaan umum, DeepSeek juga dapat digunakan untuk berbagai kebutuhan seperti:

Menulis artikel
Membuat kode program
Menjelaskan konsep teknis
Membantu troubleshooting server
Menerjemahkan teks
Membuat dokumentasi

Keterangan:
Model DeepSeek R1 memiliki kemampuan reasoning yang baik sehingga cocok digunakan untuk analisis, pemrograman, maupun menjawab pertanyaan teknis yang kompleks.

3. Contoh Prompt yang Dapat Dicoba

Beberapa contoh prompt yang dapat digunakan:

>>> Buatkan script Bash untuk backup database MySQL

>>> Jelaskan cara kerja Kubernetes

>>> Buatkan konfigurasi Nginx reverse proxy

>>> Apa perbedaan Ubuntu dan Debian?

Model akan memberikan jawaban sesuai instruksi yang diberikan.

4. Keluar dari Sesi Interaktif

Jika sudah selesai menggunakan model, keluar dari sesi interaktif dengan perintah:

/bye

Atau tekan kombinasi tombol berikut:

Ctrl + D

Setelah keluar, model akan berhenti menerima input dari terminal.

Keterangan:
Model yang telah diunduh tetap tersimpan di server sehingga dapat dijalankan kembali kapan saja menggunakan perintah ollama run tanpa perlu melakukan download ulang.

Menjalankan DeepSeek Sebagai API

1. Menguji REST API Ollama

Salah satu kelebihan Ollama adalah menyediakan REST API yang memungkinkan model AI diintegrasikan dengan berbagai aplikasi seperti website, chatbot, backend API, Open WebUI, FlowiseAI, n8n, maupun aplikasi custom lainnya.

Sebelum menggunakan API, pastikan service Ollama berjalan dengan normal.

Periksa status service menggunakan perintah berikut:

sudo systemctl status ollama

Contoh output:

● ollama.service - Ollama Service
   Loaded: loaded
   Active: active (running)

Interpretasi:

Loaded menunjukkan service berhasil dimuat oleh systemd.
Active (running) menunjukkan Ollama sedang berjalan dan siap menerima request.

Jika service belum aktif, jalankan:

sudo systemctl start ollama

Kemudian cek kembali statusnya.

Keterangan:
REST API Ollama berjalan secara default pada port 11434.

2. Menguji Koneksi API

Setelah memastikan service aktif, lakukan pengujian endpoint API menggunakan perintah berikut:

curl http://localhost:11434/api/tags

Fungsi:

Memastikan REST API Ollama dapat diakses
Menampilkan daftar model yang tersedia
Menguji konektivitas antara sistem dan service Ollama

Contoh output:

{
  "models": [
    {
      "name": "deepseek-r1:8b"
    }
  ]
}

Penjelasan Output:

models berisi daftar model yang telah tersimpan pada server.
name menunjukkan nama model yang dapat digunakan melalui API maupun terminal.

Jika model DeepSeek muncul pada daftar tersebut, berarti:

Ollama berhasil berjalan
REST API aktif
Model telah tersedia pada server
Sistem siap menerima request AI melalui HTTP API

Keterangan:
Endpoint /api/tags sering digunakan untuk memverifikasi instalasi Ollama karena tidak memerlukan prompt dan langsung menampilkan seluruh model yang tersedia dalam format JSON.

Mengirim Prompt Melalui API

1. Mengirim Prompt ke DeepSeek Melalui API

Setelah REST API Ollama berhasil diakses, langkah berikutnya adalah mengirim prompt ke model DeepSeek menggunakan endpoint /api/generate.

Endpoint ini digunakan untuk mengirim pertanyaan atau instruksi dan menerima jawaban AI dalam format JSON.

Contoh request menggunakan curl:

curl http://localhost:11434/api/generate \
-d '{
  "model":"deepseek-r1:8b",
  "prompt":"Apa itu Ubuntu?",
  "stream":false
}'

Penjelasan Parameter:

model
Menentukan model AI yang akan digunakan untuk memproses prompt.
prompt
Berisi pertanyaan atau instruksi yang dikirim ke AI.
stream
Jika bernilai false, respons akan dikirim sekaligus dalam satu objek JSON. Jika bernilai true, respons akan dikirim secara bertahap (streaming).

Contoh respons:

{
  "response":"Ubuntu adalah sistem operasi Linux yang populer..."
}

Penjelasan Respons:

response
Berisi jawaban yang dihasilkan oleh model AI berdasarkan prompt yang diberikan.

Pada implementasi aplikasi, nilai pada field response biasanya diproses dan ditampilkan kembali kepada pengguna melalui antarmuka aplikasi.

Keterangan:
Endpoint /api/generate merupakan endpoint utama yang digunakan untuk berinteraksi dengan model AI melalui aplikasi eksternal.

2. Contoh Prompt Lainnya

Beberapa contoh prompt yang dapat dicoba:

curl http://localhost:11434/api/generate \
-d '{
  "model":"deepseek-r1:8b",
  "prompt":"Jelaskan cara kerja Kubernetes",
  "stream":false
}'

Atau:

curl http://localhost:11434/api/generate \
-d '{
  "model":"deepseek-r1:8b",
  "prompt":"Buatkan script backup database MySQL menggunakan Bash",
  "stream":false
}'

Model akan menghasilkan respons sesuai instruksi yang diberikan.

3. Integrasi dengan Aplikasi Lain

REST API Ollama dapat digunakan untuk berbagai kebutuhan integrasi, antara lain:

Website
Aplikasi web
Chatbot AI
Sistem otomatisasi
Dashboard internal perusahaan
Aplikasi CRM dan Helpdesk
Workflow automation seperti n8n atau FlowiseAI
Backend API berbasis PHP, Python, Node.js, maupun Go

Karena menggunakan protokol HTTP dan format JSON, integrasi dapat dilakukan hampir dari semua bahasa pemrograman modern.

Keterangan:
Dengan REST API Ollama, model DeepSeek dapat dijalankan sepenuhnya di VPS milik sendiri tanpa bergantung pada layanan AI cloud pihak ketiga sehingga data dan proses inferensi tetap berada di lingkungan server yang Anda kelola.

Mengakses DeepSeek dari Komputer Lain

1. Membuka Akses API DeepSeek dari Jaringan Lain

Secara default, Ollama hanya menerima koneksi dari localhost (127.0.0.1). Artinya API hanya dapat diakses dari server yang sama tempat Ollama dijalankan.

Jika ingin digunakan oleh aplikasi lain yang berada pada server atau perangkat berbeda, seperti Open WebUI, FlowiseAI, n8n, website, maupun aplikasi backend, maka API perlu dikonfigurasi agar menerima koneksi dari jaringan luar.

Edit konfigurasi service Ollama:

sudo systemctl edit ollama

Tambahkan konfigurasi berikut:

[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"

Penjelasan:

0.0.0.0 berarti Ollama menerima koneksi dari seluruh interface jaringan.
11434 merupakan port default REST API Ollama.

Keterangan:
Tanpa konfigurasi ini, API hanya dapat diakses menggunakan alamat localhost dan tidak dapat digunakan oleh perangkat lain dalam jaringan.

2. Reload dan Restart Service Ollama

Setelah konfigurasi disimpan, terapkan perubahan menggunakan perintah berikut:

sudo systemctl daemon-reload

sudo systemctl restart ollama

Fungsi:

Membaca ulang konfigurasi systemd
Menerapkan perubahan alamat listener Ollama
Mengaktifkan akses API dari jaringan eksternal

Verifikasi status service:

sudo systemctl status ollama

Pastikan status menunjukkan:

active (running)

3. Membuka Port pada Firewall

Jika VPS menggunakan UFW (Uncomplicated Firewall), izinkan akses ke port API Ollama:

sudo ufw allow 11434/tcp

Periksa aturan firewall:

sudo ufw status

Contoh output:

11434/tcp                 ALLOW

Fungsi:

Membuka akses TCP ke REST API Ollama
Mengizinkan koneksi dari jaringan luar
Memungkinkan integrasi dengan aplikasi eksternal

Keterangan:
Apabila VPS menggunakan firewall dari provider cloud atau panel VPS, pastikan port 11434 juga dibuka pada level jaringan tersebut.

4. Memverifikasi Port yang Aktif

Pastikan Ollama sudah mendengarkan koneksi pada seluruh interface jaringan:

ss -tulpn | grep 11434

Contoh output:

tcp LISTEN 0 4096 0.0.0.0:11434

Interpretasi:

LISTEN menunjukkan service aktif menerima koneksi.
0.0.0.0:11434 menunjukkan API dapat diakses dari jaringan luar.

Jika output masih menunjukkan:

127.0.0.1:11434

berarti konfigurasi belum diterapkan dengan benar dan perlu diperiksa kembali.

5. Mengakses API Menggunakan IP VPS

Setelah konfigurasi berhasil diterapkan, API dapat diakses menggunakan alamat IP server.

Contoh:

http://IP-VPS:11434

Misalnya:

http://103.xxx.xxx.xxx:11434

Untuk melakukan pengujian dari perangkat lain:

curl http://IP-VPS:11434/api/tags

Jika berhasil, sistem akan menampilkan daftar model DeepSeek yang tersedia dalam format JSON.

Konfigurasi ini memungkinkan integrasi DeepSeek dengan berbagai aplikasi seperti:

Website
Aplikasi web
Open WebUI
FlowiseAI
n8n
Chatbot internal perusahaan
Aplikasi mobile
Backend API eksternal

Keterangan:
Jika API dibuka ke internet publik, sangat disarankan menggunakan reverse proxy seperti Nginx atau Traefik, mengaktifkan HTTPS, menambahkan autentikasi, serta membatasi akses berdasarkan alamat IP untuk meningkatkan keamanan server dan mencegah penyalahgunaan API.

Tips dan Best Practice Menjalankan DeepSeek di VPS

Agar performa DeepSeek tetap optimal, perhatikan beberapa hal berikut:

Gunakan VPS dengan RAM minimal 8 GB untuk model 7B atau 8B.
Pastikan ruang penyimpanan mencukupi karena model AI berukuran cukup besar.
Aktifkan firewall dan buka hanya port yang diperlukan.
Gunakan swap memory jika VPS memiliki RAM terbatas.
Hindari menjalankan terlalu banyak aplikasi berat secara bersamaan.
Lakukan update sistem Ubuntu secara berkala.
Gunakan reverse proxy dan autentikasi jika API diakses dari internet.

Kesimpulan

Install dan menjalankan DeepSeek di VPS Ubuntu dapat dilakukan dengan cukup mudah menggunakan Ollama. Prosesnya meliputi instalasi Ollama, mengunduh model DeepSeek, menjalankan model melalui terminal, hingga memanfaatkan REST API untuk integrasi aplikasi. Dengan menjalankan DeepSeek secara mandiri di VPS, Anda memperoleh kontrol penuh terhadap data, fleksibilitas penggunaan, serta kemampuan membangun berbagai layanan AI tanpa bergantung pada platform pihak ketiga. Setelah berhasil menjalankan DeepSeek, Anda dapat melanjutkan dengan mengintegrasikannya ke website, chatbot, aplikasi internal, atau sistem otomatisasi lainnya sesuai kebutuhan.