Jika anda ingin mengunduh atau download secara massal tentunya banyak terdapat software semacam Download Manager ataupun berupa plugin untuk web browser kita yang dapat menangani ini. Dari yang berbayar hingga yang gratis. Di sistem operasi berbasiskan Linux hal ini dapat dilakukan dengan mudah dengan menggunakan GNU Wget atau yang biasa disebut wget saja.
Wget adalah sebuah paket free software yang berfungsi untuk mengambil berkas-berkas menggunakan protokol-protokol Internet seperti HTTP, HTTPS, FTP dan FTPS. Wget beroperasi pada command-line di terminal, sehingga secara mudah dapat dipanggil dari skrip, cron jobs, terminal-terminal tanpa X-Windows dan lain-lain.
Memasang Wget
Bila anda menggunakan sistem operasi berbasiskan Linux seperti Ubuntu, Slackware, CentOS, dan lain-lain kemungkinan besar wget telah terpasang dari awal. Bila wget belum terpasang silakan menggunakan perintah di bawah ini:
Untuk Ubuntu:
sudo apt install wget
atau
sudo apt-get install wget
Untuk CentOS:
yum install wget
Sederhana kan?? 🙂
Mengunduh Sebuah File Menggunakan Wget
Mengunduh sebuah file dengan wget dilakukan dengan sebuah perintah sederhana:
wget http://alamat.com/nama-file-yang-ingin-diunduh.html
Mengunduh File Secara Massal Melewati Halaman Login
Anda dapat mengunduh banyak file dengan menyimpan alamat-alamatnya (URL) di sebuah file teks, satu alamat satu baris, contoh:
http://alamat.com/file1.html http://alamat2.com/file2.png -- dst
Simpan file tersebut, misalkan dengan nama unduh.txt
.
Lalu untuk mengeksekusinya gunakan perintah:
wget -i unduh.txt
Wget secara otomatis akan mengambil berkas-berkas dari alamat-alamat yang berada di dalam file unduh.txt
Lalu bagaimana seandainya file-file yang ingin kita unduh diproteksi dalam bentuk halaman login? Biasanya halaman login akan menggunakan sebuah HTTP cookie
atau biasa disebut cookie saja untuk menyimpan berbagai macam informasi, diantaranya data login. Di sinilah wget dapat login dan mengunduh file-file yang kita inginkan.
Persiapan yang perlu dilakukan adalah mengetahui parameter-parameter apa saja yang perlu diketahui yang disimpan oleh si pemilik situs web untuk login. Sebuah halaman login biasanya berupa seperti di bawah ini:
dan bila anda meng-klik kanan tombol mouse anda, memilih ‘View page source‘ biasanya kode HTML yang ditulis adalah sebagai berikut:
<input name="namauser" type="text"> <input name="katasandi" type="password">
Simpanlah nilai yang terdapat dalam atribut name untuk masing-masing kode <input>, dari contoh saya mengambil namauser untuk user name dan katasandi untuk password.
Dengan menggunakan perintah:
wget --save-cookies cookies.txt \ --keep-session-cookies \ --post-data 'namauser=NamaUserAnda&katasandi=PasswordAnda' \ --delete-after \ http://contoh.com/halaman/login/
Di mana:
– NamaUserAnda adalah nama user yang anda gunakan di situs web tersebut
– PasswordAnda adalah kata sandi yang anda gunakan.
– http://contoh.com/halaman/login/ adalah alamat halaman login situs web, dapat dilihat di kotak URL web browser anda.
Sampai saat ini wget telah menyimpan cookie berisi informasi login anda dalam file bernama cookies.txt
, dan sentuhan terakhir dapat anda gunakan untuk mengunduh file-file pada berkas berisi alamat-alamat yang telah anda simpan sebelumnya dengan perintah sebagai-berikut:
wget --load-cookies cookies.txt \ -i unduh.txt
Demikian sedikit petunjuk untuk mengunduh file-file secara massal yang diproteksi oleh halaman login.
Enjoy, semoga bermanfaat.
Pai
Terima kasih. Sangat membantu.