Cara Install dan Menjalankan DeepSeek di VPS Ubuntu
Pengantar
Model AI berbasis Large Language Model (LLM) semakin banyak digunakan untuk berbagai kebutuhan, mulai dari chatbot, pembuatan konten, analisis data, hingga membantu pekerjaan pemrograman. Salah satu model AI yang saat ini banyak diperbincangkan adalah DeepSeek karena memiliki kemampuan yang cukup baik dan tersedia dalam berbagai ukuran model yang dapat dijalankan secara lokal.
Bagi pengguna VPS Ubuntu, menjalankan DeepSeek sendiri memberikan beberapa keuntungan dibandingkan menggunakan layanan AI berbasis cloud. Selain lebih fleksibel, Anda memiliki kontrol penuh terhadap data, tidak bergantung pada layanan pihak ketiga, serta dapat mengakses model kapan saja selama VPS aktif.
Pada artikel ini, Anda akan mempelajari cara install DeepSeek di VPS Ubuntu menggunakan Ollama, mulai dari persiapan server hingga menjalankan model dan melakukan pengujian pertama.
Apa Itu DeepSeek?
DeepSeek adalah model Artificial Intelligence (AI) yang dirancang untuk memahami dan menghasilkan teks layaknya manusia. Model ini tersedia dalam beberapa varian ukuran parameter sehingga dapat disesuaikan dengan spesifikasi server yang digunakan.
Beberapa kelebihan DeepSeek antara lain:
- Mampu menjawab pertanyaan dengan konteks yang baik
- Cocok untuk kebutuhan coding assistant
- Dapat digunakan secara lokal tanpa koneksi internet setelah model diunduh
- Mendukung API untuk integrasi aplikasi
- Tersedia dalam berbagai ukuran model
Untuk menjalankan DeepSeek di VPS Ubuntu dengan mudah, kita akan menggunakan Ollama sebagai platform manajemen model AI.
Persiapan Sebelum Install DeepSeek
Berikut kebutuhan RAM untuk beberapa varian model DeepSeek yang umum digunakan:
- DeepSeek 1.5B
RAM minimal 2 GB dan disarankan menggunakan RAM 4 GB agar performa lebih stabil. - DeepSeek 7B
RAM minimal 8 GB dan direkomendasikan menggunakan RAM 16 GB untuk mendapatkan respons yang lebih lancar. - DeepSeek 8B
RAM minimal 8 GB dan direkomendasikan menggunakan RAM 16 GB terutama jika server menjalankan aplikasi lain secara bersamaan. - DeepSeek 14B
RAM minimal 16 GB dan disarankan menggunakan RAM 32 GB untuk performa optimal. - DeepSeek 32B atau lebih besar
RAM minimal 32 GB dan direkomendasikan menggunakan RAM 64 GB atau lebih karena ukuran model yang jauh lebih besar.
Prasyarat
Sebelum melakukan instalasi dan menjalankan DeepSeek di VPS Ubuntu, pastikan beberapa kebutuhan berikut sudah tersedia:
- VPS dengan sistem operasi Ubuntu 22.04 atau Ubuntu 24.04
- Akses pengguna root atau user yang memiliki hak sudo
- Koneksi internet yang stabil untuk mengunduh Ollama dan model DeepSeek
- Minimal RAM 4 GB untuk model DeepSeek 1.5B (disarankan 8 GB atau lebih untuk model yang lebih besar)
- Ruang penyimpanan (storage) yang cukup untuk menyimpan model AI
- Ollama sudah terinstall dan berjalan dengan normal di VPS
Cara Download Model DeepSeek
1. Update Sistem Ubuntu
Sebelum mengunduh dan menjalankan model DeepSeek, pastikan sistem operasi telah diperbarui ke versi terbaru agar seluruh dependency dan komponen pendukung berjalan dengan optimal.
Masuk ke VPS melalui SSH kemudian jalankan:
sudo apt update
Fungsi:
- Memperbarui daftar repository Ubuntu
- Menginstal pembaruan package terbaru
- Meningkatkan stabilitas dan keamanan sistem
- Mengurangi potensi masalah kompatibilitas saat menjalankan model AI
Perintah tersebut memastikan seluruh paket sistem berada pada versi terbaru sebelum instalasi dilakukan.
Keterangan:
Apabila terdapat pembaruan kernel atau komponen penting lainnya, lakukan reboot server setelah proses update selesai.
2. Download Model DeepSeek 8B
Setelah Ollama berhasil terpasang, langkah berikutnya adalah mengunduh model DeepSeek yang ingin digunakan.
Untuk mengunduh model DeepSeek R1 8B, jalankan:
ollama pull deepseek-r1:8b
Fungsi:
- Mengunduh model DeepSeek R1 8B ke server
- Menyimpan model secara lokal pada sistem
- Menyiapkan model agar dapat dijalankan kapan saja tanpa download ulang
Proses download dapat memakan waktu beberapa menit tergantung:
- Kecepatan koneksi internet VPS
- Performa storage server
- Ukuran model yang diunduh
Setelah download selesai, model akan tersimpan secara permanen pada server.
Keterangan:
Model DeepSeek 8B merupakan salah satu pilihan yang populer karena mampu memberikan kualitas jawaban yang baik dengan kebutuhan resource yang masih cukup terjangkau untuk sebagian besar VPS.
3. Memverifikasi Model yang Berhasil Diunduh
Untuk melihat daftar model yang tersimpan pada server, jalankan:
ollama list
Contoh output:
NAME SIZE
deepseek-r1:8b 4.9 GB
Penjelasan Output:
- NAME
Nama model yang tersedia pada server. - SIZE
Ukuran penyimpanan yang digunakan oleh model.
Jika model muncul pada daftar tersebut, berarti proses download telah berhasil dan model siap digunakan.
Keterangan:
Model yang telah tersimpan tidak perlu diunduh ulang saat akan digunakan kembali kecuali sebelumnya dihapus dari server.
4. Download Model DeepSeek Lainnya
Selain versi 8B, Ollama juga menyediakan beberapa varian DeepSeek dengan kebutuhan resource yang berbeda.
Untuk mengunduh model lain, gunakan salah satu perintah berikut:
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:7b
ollama pull deepseek-r1:14b
Karakteristik Masing-Masing Model:
- DeepSeek R1 1.5B
Ukuran lebih kecil dan cocok untuk VPS dengan RAM terbatas. - DeepSeek R1 7B
Memberikan keseimbangan antara performa dan kebutuhan resource. - DeepSeek R1 8B
Salah satu pilihan paling populer untuk kebutuhan umum seperti chatbot, coding assistant, dan pembuatan konten. - DeepSeek R1 14B
Memiliki kemampuan reasoning yang lebih baik namun membutuhkan RAM yang lebih besar.
Pilih model sesuai kapasitas RAM dan CPU VPS yang dimiliki agar proses inferensi berjalan dengan lancar.
Keterangan:
Semakin besar ukuran model, biasanya semakin baik kualitas jawaban yang dihasilkan, namun kebutuhan RAM, CPU, dan storage juga akan meningkat secara signifikan.
Cara Menjalankan DeepSeek di VPS Ubuntu
1. Menjalankan Model DeepSeek
Setelah model berhasil diunduh ke server, Anda dapat langsung menjalankannya melalui terminal menggunakan Ollama.
Untuk menjalankan model DeepSeek R1 8B, gunakan perintah berikut:
ollama run deepseek-r1:8b
Fungsi:
- Memuat model DeepSeek ke dalam memori
- Menjalankan sesi interaktif AI melalui terminal
- Menerima prompt dan menghasilkan respons secara langsung
Pada saat pertama kali dijalankan setelah proses download, model akan dimuat ke RAM sehingga mungkin membutuhkan beberapa saat tergantung spesifikasi VPS yang digunakan.
Jika berhasil, akan muncul prompt seperti berikut:
>>>
Keterangan:
Semakin besar ukuran model dan semakin kecil kapasitas VPS, semakin lama proses loading model ke memori.
2. Berinteraksi dengan AI
Setelah prompt muncul, Anda dapat langsung mengajukan pertanyaan atau memberikan instruksi kepada model.
Contoh:
>>> Jelaskan apa itu Ubuntu Linux
Model akan memproses pertanyaan dan memberikan jawaban secara otomatis.
Contoh respons:
Ubuntu adalah distribusi Linux berbasis Debian yang dikembangkan oleh Canonical dan dirancang untuk memberikan kemudahan penggunaan, stabilitas, serta dukungan komunitas yang luas.
Selain pertanyaan umum, DeepSeek juga dapat digunakan untuk berbagai kebutuhan seperti:
- Menulis artikel
- Membuat kode program
- Menjelaskan konsep teknis
- Membantu troubleshooting server
- Menerjemahkan teks
- Membuat dokumentasi
Keterangan:
Model DeepSeek R1 memiliki kemampuan reasoning yang baik sehingga cocok digunakan untuk analisis, pemrograman, maupun menjawab pertanyaan teknis yang kompleks.
3. Contoh Prompt yang Dapat Dicoba
Beberapa contoh prompt yang dapat digunakan:
>>> Buatkan script Bash untuk backup database MySQL
>>> Jelaskan cara kerja Kubernetes
>>> Buatkan konfigurasi Nginx reverse proxy
>>> Apa perbedaan Ubuntu dan Debian?
Model akan memberikan jawaban sesuai instruksi yang diberikan.
4. Keluar dari Sesi Interaktif
Jika sudah selesai menggunakan model, keluar dari sesi interaktif dengan perintah:
/bye
Atau tekan kombinasi tombol berikut:
Ctrl + D
Setelah keluar, model akan berhenti menerima input dari terminal.
Keterangan:
Model yang telah diunduh tetap tersimpan di server sehingga dapat dijalankan kembali kapan saja menggunakan perintah ollama run tanpa perlu melakukan download ulang.
Menjalankan DeepSeek Sebagai API
1. Menguji REST API Ollama
Salah satu kelebihan Ollama adalah menyediakan REST API yang memungkinkan model AI diintegrasikan dengan berbagai aplikasi seperti website, chatbot, backend API, Open WebUI, FlowiseAI, n8n, maupun aplikasi custom lainnya.
Sebelum menggunakan API, pastikan service Ollama berjalan dengan normal.
Periksa status service menggunakan perintah berikut:
sudo systemctl status ollama
Contoh output:
● ollama.service - Ollama Service
Loaded: loaded
Active: active (running)
Interpretasi:
- Loaded menunjukkan service berhasil dimuat oleh systemd.
- Active (running) menunjukkan Ollama sedang berjalan dan siap menerima request.
Jika service belum aktif, jalankan:
sudo systemctl start ollama
Kemudian cek kembali statusnya.
Keterangan:
REST API Ollama berjalan secara default pada port 11434.
2. Menguji Koneksi API
Setelah memastikan service aktif, lakukan pengujian endpoint API menggunakan perintah berikut:
curl http://localhost:11434/api/tags
Fungsi:
- Memastikan REST API Ollama dapat diakses
- Menampilkan daftar model yang tersedia
- Menguji konektivitas antara sistem dan service Ollama
Contoh output:
{
"models": [
{
"name": "deepseek-r1:8b"
}
]
}
Penjelasan Output:
- models berisi daftar model yang telah tersimpan pada server.
- name menunjukkan nama model yang dapat digunakan melalui API maupun terminal.
Jika model DeepSeek muncul pada daftar tersebut, berarti:
- Ollama berhasil berjalan
- REST API aktif
- Model telah tersedia pada server
- Sistem siap menerima request AI melalui HTTP API
Keterangan:
Endpoint /api/tags sering digunakan untuk memverifikasi instalasi Ollama karena tidak memerlukan prompt dan langsung menampilkan seluruh model yang tersedia dalam format JSON.
Mengirim Prompt Melalui API
1. Mengirim Prompt ke DeepSeek Melalui API
Setelah REST API Ollama berhasil diakses, langkah berikutnya adalah mengirim prompt ke model DeepSeek menggunakan endpoint /api/generate.
Endpoint ini digunakan untuk mengirim pertanyaan atau instruksi dan menerima jawaban AI dalam format JSON.
Contoh request menggunakan curl:
curl http://localhost:11434/api/generate \
-d '{
"model":"deepseek-r1:8b",
"prompt":"Apa itu Ubuntu?",
"stream":false
}'
Penjelasan Parameter:
- model
Menentukan model AI yang akan digunakan untuk memproses prompt. - prompt
Berisi pertanyaan atau instruksi yang dikirim ke AI. - stream
Jika bernilai false, respons akan dikirim sekaligus dalam satu objek JSON. Jika bernilai true, respons akan dikirim secara bertahap (streaming).
Contoh respons:
{
"response":"Ubuntu adalah sistem operasi Linux yang populer..."
}
Penjelasan Respons:
- response
Berisi jawaban yang dihasilkan oleh model AI berdasarkan prompt yang diberikan.
Pada implementasi aplikasi, nilai pada field response biasanya diproses dan ditampilkan kembali kepada pengguna melalui antarmuka aplikasi.
Keterangan:
Endpoint /api/generate merupakan endpoint utama yang digunakan untuk berinteraksi dengan model AI melalui aplikasi eksternal.
2. Contoh Prompt Lainnya
Beberapa contoh prompt yang dapat dicoba:
curl http://localhost:11434/api/generate \
-d '{
"model":"deepseek-r1:8b",
"prompt":"Jelaskan cara kerja Kubernetes",
"stream":false
}'
Atau:
curl http://localhost:11434/api/generate \
-d '{
"model":"deepseek-r1:8b",
"prompt":"Buatkan script backup database MySQL menggunakan Bash",
"stream":false
}'
Model akan menghasilkan respons sesuai instruksi yang diberikan.
3. Integrasi dengan Aplikasi Lain
REST API Ollama dapat digunakan untuk berbagai kebutuhan integrasi, antara lain:
- Website
- Aplikasi web
- Chatbot AI
- Sistem otomatisasi
- Dashboard internal perusahaan
- Aplikasi CRM dan Helpdesk
- Workflow automation seperti n8n atau FlowiseAI
- Backend API berbasis PHP, Python, Node.js, maupun Go
Karena menggunakan protokol HTTP dan format JSON, integrasi dapat dilakukan hampir dari semua bahasa pemrograman modern.
Keterangan:
Dengan REST API Ollama, model DeepSeek dapat dijalankan sepenuhnya di VPS milik sendiri tanpa bergantung pada layanan AI cloud pihak ketiga sehingga data dan proses inferensi tetap berada di lingkungan server yang Anda kelola.
Mengakses DeepSeek dari Komputer Lain
1. Membuka Akses API DeepSeek dari Jaringan Lain
Secara default, Ollama hanya menerima koneksi dari localhost (127.0.0.1). Artinya API hanya dapat diakses dari server yang sama tempat Ollama dijalankan.
Jika ingin digunakan oleh aplikasi lain yang berada pada server atau perangkat berbeda, seperti Open WebUI, FlowiseAI, n8n, website, maupun aplikasi backend, maka API perlu dikonfigurasi agar menerima koneksi dari jaringan luar.
Edit konfigurasi service Ollama:
sudo systemctl edit ollama
Tambahkan konfigurasi berikut:
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
Penjelasan:
- 0.0.0.0 berarti Ollama menerima koneksi dari seluruh interface jaringan.
- 11434 merupakan port default REST API Ollama.
Keterangan:
Tanpa konfigurasi ini, API hanya dapat diakses menggunakan alamat localhost dan tidak dapat digunakan oleh perangkat lain dalam jaringan.
2. Reload dan Restart Service Ollama
Setelah konfigurasi disimpan, terapkan perubahan menggunakan perintah berikut:
sudo systemctl daemon-reload
sudo systemctl restart ollama
Fungsi:
- Membaca ulang konfigurasi systemd
- Menerapkan perubahan alamat listener Ollama
- Mengaktifkan akses API dari jaringan eksternal
Verifikasi status service:
sudo systemctl status ollama
Pastikan status menunjukkan:
active (running)
3. Membuka Port pada Firewall
Jika VPS menggunakan UFW (Uncomplicated Firewall), izinkan akses ke port API Ollama:
sudo ufw allow 11434/tcp
Periksa aturan firewall:
sudo ufw status
Contoh output:
11434/tcp ALLOW
Fungsi:
- Membuka akses TCP ke REST API Ollama
- Mengizinkan koneksi dari jaringan luar
- Memungkinkan integrasi dengan aplikasi eksternal
Keterangan:
Apabila VPS menggunakan firewall dari provider cloud atau panel VPS, pastikan port 11434 juga dibuka pada level jaringan tersebut.
4. Memverifikasi Port yang Aktif
Pastikan Ollama sudah mendengarkan koneksi pada seluruh interface jaringan:
ss -tulpn | grep 11434
Contoh output:
tcp LISTEN 0 4096 0.0.0.0:11434
Interpretasi:
- LISTEN menunjukkan service aktif menerima koneksi.
- 0.0.0.0:11434 menunjukkan API dapat diakses dari jaringan luar.
Jika output masih menunjukkan:
127.0.0.1:11434
berarti konfigurasi belum diterapkan dengan benar dan perlu diperiksa kembali.
5. Mengakses API Menggunakan IP VPS
Setelah konfigurasi berhasil diterapkan, API dapat diakses menggunakan alamat IP server.
Contoh:
http://IP-VPS:11434
Misalnya:
http://103.xxx.xxx.xxx:11434
Untuk melakukan pengujian dari perangkat lain:
curl http://IP-VPS:11434/api/tags
Jika berhasil, sistem akan menampilkan daftar model DeepSeek yang tersedia dalam format JSON.
Konfigurasi ini memungkinkan integrasi DeepSeek dengan berbagai aplikasi seperti:
- Website
- Aplikasi web
- Open WebUI
- FlowiseAI
- n8n
- Chatbot internal perusahaan
- Aplikasi mobile
- Backend API eksternal
Keterangan:
Jika API dibuka ke internet publik, sangat disarankan menggunakan reverse proxy seperti Nginx atau Traefik, mengaktifkan HTTPS, menambahkan autentikasi, serta membatasi akses berdasarkan alamat IP untuk meningkatkan keamanan server dan mencegah penyalahgunaan API.
Tips dan Best Practice Menjalankan DeepSeek di VPS
Agar performa DeepSeek tetap optimal, perhatikan beberapa hal berikut:
- Gunakan VPS dengan RAM minimal 8 GB untuk model 7B atau 8B.
- Pastikan ruang penyimpanan mencukupi karena model AI berukuran cukup besar.
- Aktifkan firewall dan buka hanya port yang diperlukan.
- Gunakan swap memory jika VPS memiliki RAM terbatas.
- Hindari menjalankan terlalu banyak aplikasi berat secara bersamaan.
- Lakukan update sistem Ubuntu secara berkala.
- Gunakan reverse proxy dan autentikasi jika API diakses dari internet.
Kesimpulan
Install dan menjalankan DeepSeek di VPS Ubuntu dapat dilakukan dengan cukup mudah menggunakan Ollama. Prosesnya meliputi instalasi Ollama, mengunduh model DeepSeek, menjalankan model melalui terminal, hingga memanfaatkan REST API untuk integrasi aplikasi. Dengan menjalankan DeepSeek secara mandiri di VPS, Anda memperoleh kontrol penuh terhadap data, fleksibilitas penggunaan, serta kemampuan membangun berbagai layanan AI tanpa bergantung pada platform pihak ketiga. Setelah berhasil menjalankan DeepSeek, Anda dapat melanjutkan dengan mengintegrasikannya ke website, chatbot, aplikasi internal, atau sistem otomatisasi lainnya sesuai kebutuhan.


