pinterduit blog logo Pinterduit.com

Platform ngeblog asli buatan lokal, menulis itu untuk melepas beban bukan untuk menambah beban







Home » Internet



Membuat Web Scraper Dengan PHP

ERNDT • Internet • 24 Aug 2020 • 112 Dilihat • publish




Pinterduit.com - web scraper adalah sebuah tools yang digunakan untuk mengekstrak data tertentu dari sebuah website misalnya judul artikel, isi, artikel, email, file gambar dsb.

Biasa nya sebuah crawler dan scrapper dibuat menggunakan bahasa pemrograman java dan python karena kecepatan bahasa tersebut cukup bagus dan kedua bahasa pemrograman tersebut merupakan bahasa scripting yang multirole, bisa dipakai untuk tujuan apa saja.

Namun bagi yang belum mempelajari kedua bahasa tersebut dan sudah memahami PHP, kita juga dapat membuat web scraper sederhana menggunakan PHP. kita membutuhkan library simple html dom. download saja dari situs resminya di sourceforge.net

Berikut ini adalah contoh mengambil judul dari sebuah website

<?php
include 'simple_html_dom.php';

$html = new simple_html_dom();

$html->load_file("http://google.com");
foreach($html->find('title') as $title){
echo $title->plaintext;

}

?>

untuk coding lengkap seperti melakukan scraping image dan link bisa anda lihat sendiri di documentation resmi php simple html dom

inti cara kerjanya adalah mengubah file html menjadi string dan memparse html tersebut, kita sendiri yang menentukan isi dari tag html yang akan kita scrape.

alur proses crawling dan scraping.

cari file sitemap dari sebuah website. biasanya disini http://example.com/sitemap.xml
lalu ekstrak link dari sitemap tersebut, dan untuk masing masink link kita ekstrak judul dan isi artikelnya, setelah itu bebas mau dikirim via email atau mau di insert ke database mysql

Artikel ini diterbitkan untuk Pinterduit.com dengan judul Membuat Web Scraper Dengan PHP




Bagikan Artikel Ini
full html code

link

BB Code