U schijnt om een versie van de Ontdekkingsreiziger van Internet te gebruiken. Voor een veiligere het doorbladeren ervaring, gelieve na te denken en

Als u hier nieuw bent, kunt u aan ons voer RSS evenals aan onze NewsLetter ( opHoogste Rechts menu) willen intekenen om hoogst informatieve artikelen... en nr wekelijks te worden, wij nooit spam!

Na het vorige artikel (dat ik enkel 5 minuten achter) publiceerde op PHP kan de Bezinning API en hoe wij het gebruiken om ingenieursmanuscripten om te keren liet me een ander semi-geavanceerd artikel aanzetten.

Hoewel PHP een Webtaal is en om hoofdzakelijk gebruikt te dienen/overeenkomstenWeb-pagina's maar er talrijk andere mogelijkheden zijn die met php. Web Bots kunnen worden bereikt of de spinnen voor vele doeleinden zijn. Php is ook niet de populairste taal voor het ontwikkelen van één. Gewoonlijk impliceert een botstaak de toegang tot van Web-pagina's en het halen van informatie. Dit is iets die kan gemakkelijk met php. worden bereikt Vandaag zullen wij leren hoe te om dit te doen; dat betekent, toegang hebbend tot een pagina en halend info van het.

Hoe te om Bots, Spinnen en Kruippakjes met PHP te creëren

Zoals voordien gezegd, basisbot's de taak is een Web-pagina te halen en noodzakelijke informatie van het te ontleden. Om deze taak te verwezenlijken die wij hebben moeten om deze procedures volgen:
* Verzoek om een pagina.
* Volg opnieuw richt indien gevraagd
* Haal de pagina
* Ontleed de pagina voor informatie

Dit is de basisprocedure die door zelfs het meest geavanceerd wordt gevolgd bots. Wij zullen een verbinding bot creëren die zal kijken of een bepaalde verbinding of niet bestaat.

Om dit in PHP te doen zullen wij de uitbreiding van de KRUL gebruiken. Zorg zo ervoor het geïnstalleerd en geactiveerd is. In plaats van het gebruiken van de functies manueel, zullen wij een de omslagklasse van de KRUL gebruiken. Deze klasse kan (http://phpclasses.org) hier worden gevonden

De codes
Veronderstel bot URL van de pagina als argument van de bevellijn krijgt. Zo de code om URL te krijgen,

 
#!/usr/bin/php
als (# ! = 3 || leeg(#[1]) || leeg(#[2])){
   de echo "te 
geven gelieve een URL en een patroon";
} anders {
  echo #[1];
   require_once("class.curl.php");
   # = nieuwe krul(#[1]);
   #- >setopt(ware 
CURLOPT_FOLLOWLOCATION );
   # = #- >exec();
   als (# = #- >hasError())
   {
   	  echo # ;
   	  #- >dicht() ;
   	  uitgang();
   }
   #- >dicht() ;
}
 
? >

De codes boven controles of een argument werd overgegaan en indien overgegaan dan begint de klasse van de KRUL. De klasse van de KRUL neemt URL van de pagina als arg. Na dat specificeren wij een optie van de KRUL te volgen opnieuw richt. U ziet hoe gemakkelijk wij dit ver zijn gegaan. Het schrijven van dit zonder KRUL zou verscheidene lijnen van code genomen hebben. Tot slot roepen wij de execmethode die haalt en alle paginagegevens terugkeert.

Het ontleden van de gegevens
Wij hebben het harde deel gedaan. Wij hebben de pagina gehaald nu wij enkel moeten controleren of de bijzondere verbinding of niet bestaat. Om dit te doen, zullen wij het tweede argument gebruiken dat de bijzondere te zoeken verbinding zal specificeren. Wij zullen enkel een eenvoudige stroppenfunctie gebruiken. Het is mogelijk aan RegEx voor betere patroon aanpassing maar wij zullen de eenvoudige versie gebruiken om het eenvoudig te houden.

 
   als (strpos(#, #[2])) {
   	  echo "gevonden Verbinding";
   } anders {
   	  echo "gevonden niet Verbinding";
   }

Dit is eenvoudigst van bot mogelijk. U kunt het uitbreiden door meer bevestiging, een gegevensbestand zo toe te voegen enz. Het doel van dit artikel was het creëren van bot te tonen, zijn de spin en het kruippakje zo geen moeilijke taak aangezien het kan klinken. Het is enkel een ander type van gegevenserkenning. Nowl leidt tot wat geavanceerd bots met PHP en zette de verbindingen als commentaren aan hen. Ik zou aan meer over dit onderwerp houden van.

Deel en geniet van: Deze pictogrammen verbinden met sociale bookmarking plaatsen waar de lezers nieuwe Web-pagina's delen en kunnen ontdekken.
  • Digg
  • del.icio.us
  • DZone
  • ThisNext
  • blinkbits
  • BlinkList
  • blogmarks
  • Fark
  • Furl
  • Netscape
  • Reddit
  • Spurl
  • StumbleUpon
  • Technorati
1 Ster2 Sterren3 Sterren4 Sterren5 Sterren (Geen Classificaties nog)
Het laden...  Het laden...

De verbindingen u kunnen interessant vinden -

Één Reactie op “Creating Bots, Spinnen en Kruippakjes met PHP”

  1. MyAvatars 0,2 mainlander zegt:

    een welk groot artikel! Hartelijk dank!
    Is er om het even welke mogelijkheid om op sommige artikelen meer over het zelfde te zetten onderwerp (bot technologieën)? Misschien kan het verzenden rechtstreeks naar mijn postadres een alternatieve manier zijn (hazine.webzine@gmail.com)

Post een Commentaar