Internet, Linux

Mengunduh File Secara Massal Melewati Login dengan Wget

Ilustrasi wget untuk artikel Mengunduh File Secara Massal Melewati Login dengan Wget

Ilustrasi wget untuk artikel Mengunduh File Secara Massal Melewati Login dengan Wget

Jika anda ingin mengunduh atau download secara massal tentunya banyak terdapat software  semacam Download Manager ataupun berupa plugin untuk web browser kita yang dapat menangani ini. Dari yang berbayar hingga yang gratis. Di sistem operasi berbasiskan Linux hal ini dapat dilakukan dengan mudah dengan menggunakan GNU Wget atau yang biasa disebut wget saja. 

Wget adalah sebuah paket free software yang berfungsi untuk mengambil berkas-berkas menggunakan protokol-protokol Internet seperti HTTP, HTTPS, FTP dan FTPS. Wget beroperasi pada command-line  di terminal, sehingga secara mudah dapat dipanggil dari skrip, cron jobs, terminal-terminal tanpa X-Windows dan lain-lain.

Memasang Wget

Bila anda menggunakan sistem operasi berbasiskan Linux seperti Ubuntu, Slackware, CentOS, dan lain-lain kemungkinan besar wget telah terpasang dari awal. Bila wget belum terpasang silakan menggunakan perintah di bawah ini:

Untuk Ubuntu:

sudo apt install wget

atau

sudo apt-get install wget

Untuk CentOS:

yum install wget

Sederhana kan?? 🙂

Mengunduh Sebuah File Menggunakan Wget

Mengunduh sebuah file dengan wget dilakukan dengan sebuah perintah sederhana:

wget http://alamat.com/nama-file-yang-ingin-diunduh.html

Mengunduh File Secara Massal Melewati Halaman Login

Anda dapat mengunduh banyak file dengan menyimpan alamat-alamatnya (URL) di sebuah file teks, satu alamat satu baris, contoh:

http://alamat.com/file1.html
http://alamat2.com/file2.png
-- dst

Simpan file tersebut, misalkan dengan nama unduh.txt.

Lalu untuk mengeksekusinya gunakan perintah:

wget -i unduh.txt

Wget secara otomatis akan mengambil berkas-berkas dari alamat-alamat yang berada di dalam file unduh.txt

Lalu bagaimana seandainya file-file yang ingin kita unduh diproteksi dalam bentuk halaman login? Biasanya halaman login akan menggunakan sebuah HTTP cookie atau biasa disebut cookie saja untuk menyimpan berbagai macam informasi, diantaranya data login. Di sinilah wget dapat login dan mengunduh file-file yang kita inginkan.

Persiapan yang perlu dilakukan adalah mengetahui parameter-parameter apa saja yang perlu diketahui yang disimpan oleh si pemilik situs web untuk login. Sebuah halaman login biasanya berupa seperti di bawah ini:

Contoh halaman login

Halaman login

dan bila anda meng-klik kanan tombol mouse anda, memilih ‘View page source‘ biasanya kode HTML yang ditulis adalah sebagai berikut:

<input name="namauser" type="text">
<input name="katasandi" type="password">

Simpanlah nilai yang terdapat dalam atribut name untuk masing-masing kode <input>, dari contoh saya mengambil namauser untuk user name dan katasandi untuk password.

Dengan menggunakan perintah:

wget --save-cookies cookies.txt \
     --keep-session-cookies \
     --post-data 'namauser=NamaUserAnda&katasandi=PasswordAnda' \
     --delete-after \
     http://contoh.com/halaman/login/

Di mana:
– NamaUserAnda adalah nama user yang anda gunakan di situs web tersebut
– PasswordAnda adalah kata sandi yang anda gunakan.
– http://contoh.com/halaman/login/ adalah alamat halaman login situs web, dapat dilihat di kotak URL web browser anda.

Sampai saat ini wget telah menyimpan cookie berisi informasi login anda dalam file bernama cookies.txt, dan sentuhan terakhir dapat anda gunakan untuk mengunduh file-file pada berkas berisi alamat-alamat yang telah anda simpan sebelumnya dengan perintah sebagai-berikut:

wget --load-cookies cookies.txt \
	 -i unduh.txt

Demikian sedikit petunjuk untuk mengunduh file-file secara massal yang diproteksi oleh halaman login.

Enjoy, semoga bermanfaat.

1 Comment

  1. Pai

    Terima kasih. Sangat membantu.

Leave a Reply