SEO Tools und Scripte zum Sammeln von Daten

04.01.2009
von Sebastian Müller

In letzter Zeit habe ich mich sehr viel damit beschäftigt, wie ich meine Seiten besser analysieren und danach natürlich auch verbessern kann.

Um nicht den Überblick zu verlieren, habe ich mir dafür einige SEO Tools programmiert, mit denen ich einen guten Überblick über Veränderung habe und so schneller arbeiten kann. Unter anderem habe ich dafür auch einige Codeschnipsel/Scripte verwendet. Einige möchte ich euch heute vorstellen. Dazu möchte ich aber sagen, dass ihr diese Scripts auf eigene Gefahr nutzt. Nicht jedes Script ist so ganz legal…

Google Analytics Scrapen

Dieses Ruby Script liest die Keywords eurer Seiten in Google Analytics aus, über die die Besucher auf deine Seite gelangt sind. Wer ein bisschen PHP Kenntnisse hat, wird dies auch in PHP hinbekommen. Ich selber benutze es, um regelmäßig die Keywords zu überwachen, bei denen ich ranke.

(via Gerald vom S-O-S SEO Blog)

Google SERPS Scrapen

Um Keywords überwachen zu können, muss man natürlich auch die SERPS scrapen/crawlen und auswerten. Google verbietet automatisierte Anfragen in ihren Richtlinien, jedoch sind Richtlinien keine Gesetze.

Am einfachsten geht das Scrapen der SERPS mit PHP + Curl (Ein Modul für PHP).

Dazu möchte ich einen kleinen Codeschnipsel zur Verfügung stellen. Damit könnt ihr die Top 100 SERPS abfragen. Auf eurem Server muss das Modul “mod_curl” unbedingt aktiviert sein:

  1. function crawlserps($google, $keyword) {
  2. $rCurlRes = curl_init();
  3. curl_setopt($rCurlRes, CURLOPT_URL,$google."/search?q=".urlencode($keyword)."&ie=utf-8&oe=utf-8&num=100");
  4. curl_setopt($rCurlRes, CURLOPT_USERAGENT, ‘Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.13)’);
  5. curl_setopt($rCurlRes, CURLOPT_AUTOREFERER, true);        
  6.  
  7. curl_setopt($rCurlRes, CURLOPT_RETURNTRANSFER, 1);
  8. curl_setopt($rCurlRes, CURLOPT_REFERER, $google);
  9. curl_setopt($rCurlRes, CURLOPT_TIMEOUT, 2);
  10. curl_setopt($rCurlRes, CURLOPT_HEADER, 0);
  11.  
  12. $res = curl_exec($rCurlRes);
  13. $curlinfo = curl_getinfo($rCurlRes);
  14.  
  15. $html = @mb_convert_encoding($res, ‘HTML-ENTITIES’, ‘utf-8′);
  16.  
  17. if(!empty($html)) {
  18. $dom = new DOMDocument();
  19. @$dom->loadHTML($html);
  20. $nodes = $dom->getElementsByTagName(‘*’);
  21. foreach($nodes as $node){
  22.         $inodes = $node->childNodes;
  23.         if($node->nodeName == ‘h3′) {
  24.  
  25.         // SEARCH FOR SITE POSITIONS
  26.          foreach($inodes as $inode){
  27.                 if($inode->nodeName == ‘a’ && $inode->getAttribute(‘class’) == "l")  {
  28.                         $positions[$p][‘link’] =  $inode->getAttribute(‘href’);
  29.                         $positions[$p][‘title’] = $node->nodeValue;
  30.                         $p++;
  31.                 }
  32.         }
  33.         } //if h3
  34.  
  35.         // YOUTUBE VIDEOS
  36.         if($node->nodeName == "font" && $node->getAttribute(’size’) == "-1" ) {
  37.                 $positions[$p][‘link’] = "http://www.youtube.com/";
  38.                 $positions[$p][‘title’] = "YouTube Video";
  39.                 $p++;
  40.         }
  41.         } // foreach
  42. }
  43.  
  44. return $positions;
  45. }

Entschuldigt die etwas unsortierte Form, doch es muss ja auch in die Seite passen. Diese Funktion liefert euch die Top 100 in den SERPS in einem Array zurück. In diesem Array wird die URL und der Titel der Seite gespeichert. Ich hoffe damit einigen Leuten helfen zu können.

Vergleichbares habe ich im Internet leider nicht gefunden, daher habe ich dann selbst umgesetzt. Ich gebe zu, perfekt ist dieses Script noch nicht, aber es funktioniert super ;)

Google Suggest scrapen

google sugest scraper

Zuletzt möchte ich euch noch ein kleines Tool vorstellen, dass Keywords von Google Suggest liefert. Damit sind die Keywords gemeint, die erscheinen, wenn man etwas falsch schreibt, es sehr wenig Suchergebnisse gibt oder ein verwandtes Keyword viel mehr Suchanfragen hat. Dieses Tool liefert zur Zeit leider nur englische und italienische Keywords.

Social News / Bookmarks

RSS

8 Antworten zu “SEO Tools und Scripte zum Sammeln von Daten”

  • markus schrieb am 05. Januar 2009 um 20:00 Uhr:

    Danke für das 3. Tool.

    Zum zweiten kann ich dir Site-Rank empfehlen: http://www.website-spy.de/monitoring-tools/site-rank/

    Ansonsten suche ich meine Keywords immer noch per Hand aus Google Analayitcs raus.

  • Nicht alles, was gemacht werden kann … - Kein Coder schrieb am 08. Januar 2009 um 08:38 Uhr:

    [...] Müller beispielsweise listet 3 Content-Scraper auf. Darunter sind solche Perlen wie “Google-SERPS auslesen” (was ganz klar gegen die [...]

  • SEO Notes schrieb am 10. Januar 2009 um 23:46 Uhr:

    Hi,
    mal nen Tipp: Dein Ansatz hat einen Fehler. Wenn Du die Top 100 von Google holst um Deine Position zu prüfen, sind die Ergebnisse anders als wenn Du wie normale User über 10er Schritte gehst.

  • Alex schrieb am 12. Januar 2009 um 14:54 Uhr:

    Hi,
    I’m the author of Google Suggest Scraper.
    Thanks for the nice review!
    I hope you’are happy to know that I’m going to add support for German language in few days :-)

    Cheers

  • Snap schrieb am 22. Januar 2009 um 12:50 Uhr:

    Gute Liste! Auf die Art habe ich das noch nier versucht. Werde das mal Testen.

  • Philipp schrieb am 22. Januar 2009 um 15:16 Uhr:

    Der SERPS Scrapper ist mit Vorsicht zu genießen. Ich hab mal mit einem eigenen Skript die TOP 10.000 durchrattern lassen und durfte anschließend Google nicht mehr verwenden (IP gesperrt für alle Dienste)…

    Besser eine kleine Pause zwischen jeder Abfrage einbauen ;-)

  • Peter schrieb am 04. Februar 2009 um 15:28 Uhr:

    Das mit der Sperrung von Google kann ich leider bestätigen. Um dies zu um gehen verwende ich den kostenloses SEO TRACKER, der logt die Positionen meiner Keywords mit.

  • Homepage Ben schrieb am 12. Juni 2009 um 15:13 Uhr:

    Hey danke für die tools…
    @markus danke für den link hat mir echt prima weitergeholfen!

Hinterlasse eine Antwort

XHTML: Folgende Tags sind erlaubt: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>