2012-04-12 3 views
2

Ich möchte verhindern, dass Google PDFs auf meiner Website indexiert.Wie kann ich feststellen, ob Apache meinen .htaccess wie vorgesehen verwendet?

Ich habe meine .htaccess-Datei modifiziert die folgenden Zeilen enthalten, wie von Google Webmaster-Tools vorgeschlagen:

<Files ~ "\.pdf$"> 
    Header set X-Robots-Tag "noindex, nofollow" 
</Files> 

Ich weiß, dass Apache richtig läuft und meine .htaccess-Datei zu lesen, weil ich den Zugriff blockieren zu der Datei vollständig, aber ich kann nicht sagen, ob der obige Befehl funktioniert.

Die Google Webmaster-Tools behaupten, dass die Crawler die PDFs zwar sehen können, aber sie scheinen nur für die Verwendung mit robots.txt gedacht zu sein. Gibt es ein Drittanbieter-Tool (für Linux), mit dem ich die Meta-Tags überprüfen kann?

Antwort

1

Sie könnten wget auf einige der PDF-Dateien verwenden und die Header aussehen:

wget -S http://host/something.pdf 
+0

Danke, das ist genau das Flag ich suchte. –