Back to Question Center
0

Seməlt: PHP Web-səhifə Çizilməsinə 3 addım

1 answers:
Veb-məlumatların çıxarılması və ya web-məhsulu kimi tanınan web-kazıma, bir veb-saytdan və ya blogdan məlumat çıxarmaq prosesi. Bu məlumat, sonra meta etiketləri, meta təsvirləri, açar sözlər və bir saytın keçidləri üçün axtarış mühərriki nəticələrində ümumi performansını artırmaq üçün istifadə olunur.
  • Sənədlərin ayrılması - DOM-a çevrilən bir XML və ya HTML sənədini əhatə edir (Document Object Model ) faylları. PHP bizə böyük DOM uzadılması ilə təmin edir.
  • Daimi ifadələr - Web sənədlərindən müntəzəm ifadələr şəklində məlumatların kazılması üsuludur.

Üçüncü şəxslərin veb saytlarının qazma məlumatları ilə əlaqədar bu məlumatı istifadə etmək üçün icazəniz yoxdur, çünki onun müəllif hüquqları ilə əlaqəli deyil - passport renewal barbados. Lakin PHP ilə, müəllif hüquqları və ya keyfiyyəti ilə bağlı problemlər olmadan asanlıqla məlumatları sökə bilərsiniz. Bir PHP proqramçısı olaraq, kodlaşdırma məqsədləri üçün müxtəlif veb saytlardan məlumatlara ehtiyacınız ola bilər. Burada digər saytlardan məlumatları necə səmərəli əldə edə biləcəyimizi izah etdik, amma bundan əvvəl, index.php və ya scrape.js faylları əldə edəcəyinizə əmin olmalısınız.

Addımlar 1: Veb səhifə URL'sini daxil etmək üçün Form yarat:

Əvvəla, Submit düyməsinə basaraq index.php formunu yaratmalısınız və məlumatların kazılması üçün veb sayt URL'sini daxil edin.



Veb səhifənin URL'sini Scrape Data

(44



Addımlar2: PHP funksiyasını Veb saytı əldə etmək üçün yaradın:

İkinci addım yaratmaqdır PHP funksiyası scrape.php faylında silinir, çünki məlumat əldə etməyə və URL kitabxanasından istifadə etməyə kömək edəcəkdir. Həmçinin, müxtəlif serverlər və protokollarla heç bir əlaqə yaratmadan əlaqə yaratmaq və ünsiyyət qurmağa imkan verir..

funksiyası scrapeSiteData ($ website_url) {

(! Function_exists ('curl_init')) {

die ('cURL yüklü deyil. ');

}

$ curl = curl_init

;

curl_setopt ($ curl, CURLOPT_URL, $ website_url);

curl_setopt ($ curl, CURLOPT_RETURNTRANSFER, true);

$ output = curl_exec ($ curl);

curl_close ($ curl);

return $ output;

}

Burada PHP cURL-in düzgün və ya düzgün quraşdırılmadığını görə bilərik. Funksiyalar sahəsində üç əsas cURL istifadə olunmalıdır və curl_init

sessiyaları başlamaq üçün kömək edəcək, curl_exec

bunu icra edəcək və curl_close

əlaqəni bağlamağa kömək edəcəkdir. CURLOPT_URL kimi dəyişənlər biz qazanmaq üçün lazım olan veb sayt URLlərini təyin etmək üçün istifadə olunur. İkinci CURLOPT_RETURNTRANSFER, nəticədə bütün web səhifəsini göstərən default şəklində deyil, əvəzli səhifələrdə saxlanan səhifələri dəyişən forma saxlamağa kömək edəcəkdir.

Adımlar3: Vebdən Səs Verən Xüsusi Məlumatlar:

PHP dosyanızın funksiyalarını idarə etmək və veb-səhifənizin xüsusi hissəsini götürmək zamanı. Müəyyən bir URL'den bütün məlumatları istəmirsinizsə, CURLOPT_RETURNTRANSFER dəyişənlərindən istifadə edərək, qırxmaq istədiyiniz bölmələrdən istifadə etməlisiniz.

if (isset ($ _ POST ['submit'])) {

$ html = scrapeWebsiteData ($ _ POST ['website_url']);

$ start_point = strpos ($ html, 'Son Mesajlar');

$ end_point = strpos ($ html, '', $ start_point);

$ uzunluğu = $ end_point- $ start_point;

$ html = substr ($ html, $ start_point, $ length);

echo $ html;

}

Bu kodlardan hər hansı birini istifadə etməzdən və ya şəxsi məqsədlər üçün xüsusi bir blog və ya veb-saytdan istifadə etməzdən əvvəl PHP və Normal İfadələrin əsas məlumatlarını inkişaf etdirməyi təklif edirik.

December 8, 2017