Als u hier nieuw bent, kunt u aan ons voer RSS evenals aan onze NewsLetter ( opHoogste Rechts menu) willen intekenen om hoogst informatieve artikelen... en nr wekelijks te worden, wij nooit spam!
Na het vorige artikel (dat ik enkel 5 minuten achter) publiceerde op PHP kan de Bezinning API en hoe wij het gebruiken om ingenieursmanuscripten om te keren liet me een ander semi-geavanceerd artikel aanzetten.
Hoewel PHP een Webtaal is en om hoofdzakelijk gebruikt te dienen/overeenkomstenWeb-pagina's maar er talrijk andere mogelijkheden zijn die met php. Web Bots kunnen worden bereikt of de spinnen voor vele doeleinden zijn. Php is ook niet de populairste taal voor het ontwikkelen van één. Gewoonlijk impliceert een botstaak de toegang tot van Web-pagina's en het halen van informatie. Dit is iets die kan gemakkelijk met php. worden bereikt Vandaag zullen wij leren hoe te om dit te doen; dat betekent, toegang hebbend tot een pagina en halend info van het.
Hoe te om Bots, Spinnen en Kruippakjes met PHP te creëren
Zoals voordien gezegd, basisbot's de taak is een
Web-pagina te halen en noodzakelijke informatie van het te ontleden.
Om deze taak te verwezenlijken die wij hebben moeten om deze
procedures volgen:
* Verzoek om een pagina.
* Volg opnieuw richt indien gevraagd
* Haal de pagina
* Ontleed de pagina voor informatie
Dit is de basisprocedure die door zelfs het meest geavanceerd wordt gevolgd bots. Wij zullen een verbinding bot creëren die zal kijken of een bepaalde verbinding of niet bestaat.
Om dit in PHP te doen zullen wij de uitbreiding van de KRUL gebruiken. Zorg zo ervoor het geïnstalleerd en geactiveerd is. In plaats van het gebruiken van de functies manueel, zullen wij een de omslagklasse van de KRUL gebruiken. Deze klasse kan (http://phpclasses.org) hier worden gevonden
De codes
Veronderstel bot URL van de pagina als argument van de
bevellijn krijgt. Zo de code om URL te krijgen,
#!/usr/bin/php als (# ! = 3 || leeg(#[1]) || leeg(#[2])){ de echo "te geven gelieve een URL en een patroon"; } anders { echo #[1]; require_once("class.curl.php"); # = nieuwe krul(#[1]); #- >setopt(ware CURLOPT_FOLLOWLOCATION ); # = #- >exec(); als (# = #- >hasError()) { echo # ; #- >dicht() ; uitgang(); } #- >dicht() ; } ? >
De codes boven controles of een argument werd overgegaan en indien overgegaan dan begint de klasse van de KRUL. De klasse van de KRUL neemt URL van de pagina als arg. Na dat specificeren wij een optie van de KRUL te volgen opnieuw richt. U ziet hoe gemakkelijk wij dit ver zijn gegaan. Het schrijven van dit zonder KRUL zou verscheidene lijnen van code genomen hebben. Tot slot roepen wij de execmethode die haalt en alle paginagegevens terugkeert.
Het ontleden van de gegevens
Wij hebben het harde deel gedaan. Wij hebben de
pagina gehaald nu wij enkel moeten controleren of de bijzondere
verbinding of niet bestaat. Om dit te doen, zullen wij het
tweede argument gebruiken dat de bijzondere te zoeken verbinding zal
specificeren. Wij zullen enkel een eenvoudige stroppenfunctie
gebruiken. Het is mogelijk aan RegEx voor betere patroon
aanpassing maar wij zullen de eenvoudige versie gebruiken om het
eenvoudig te houden.
als (strpos(#, #[2])) { echo "gevonden Verbinding"; } anders { echo "gevonden niet Verbinding"; }
Dit is eenvoudigst van bot mogelijk. U kunt het uitbreiden door meer bevestiging, een gegevensbestand zo toe te voegen enz. Het doel van dit artikel was het creëren van bot te tonen, zijn de spin en het kruippakje zo geen moeilijke taak aangezien het kan klinken. Het is enkel een ander type van gegevenserkenning. Nowl leidt tot wat geavanceerd bots met PHP en zette de verbindingen als commentaren aan hen. Ik zou aan meer over dit onderwerp houden van.
De verbindingen u kunnen interessant vinden -
- Sparen om het even welke Web-pagina (of blog pagina) als Pdf- dossier en op uw Computer
- Hoe te om Wordpress als CMS te gebruiken?
- Vertaal nu uw website in 12 verschillende vreemde talen gebruikend de Vertaling van Google en van yahoo
- Hoe te om voer RSS in PHP te creëren?
- Het gebruiken van PHP Bezinning API om de Manuscripten van de Ingenieur om te keren





























11 september, 2007 om 1:44 p.m.
een welk groot artikel! Hartelijk dank!
Is er om het even welke mogelijkheid om op sommige artikelen meer over het zelfde te zetten onderwerp (bot technologieën)? Misschien kan het verzenden rechtstreeks naar mijn postadres een alternatieve manier zijn (hazine.webzine@gmail.com)