2009-08-03 7 views
2

:Erste Sitemap ist HTML von Google Webmaster Tool

Ich habe eine sehr einfache txt-Sitemap (benannt sitemap.txt) [Hinweis zu den Weisen Sprung EDIT dauern], die wie folgt aussieht:

http://myDomain.com 
http://myDomain.com/about.html 
http://myDomain.com/faq.html 
http://myDomain.com/careers.html 

Wenn ich es auf Webmaster-Tools laden, bis ich:

Sitemap ist HTML - Ihre Sitemap erscheint eine HTML-Seite zu sein. Bitte verwenden Sie ein unterstütztes Sitemap-Format statt

Ich habe ein paar Alternativen (wie mit oder ohne www) versucht, aber kein Glück.

Jeder irgendeinen Anhaltspunkt?

Jede Hilfe wird geschätzt!

EDIT:

Ich habe versucht, mit einer XML-Sitemap und die gleichen Fehler so sieht es aus wie der Server alles als HTML dient, ist (wie ceejayoz schlägt korrekt). Jetzt ist die Frage ... Wie bekomme ich den appspot Server zum Servertext als Klartext?

EDIT:

Ok - habe ich satt und implementiert ein Servlet meine Sitemaps zu dienen (ich bin jetzt mit XML und TXT versuchen) explizit als text/plain. Alles funktioniert gut, wenn ich das Servlet manuell aufruft, aber die Sitemap immer noch HTML erhält. Ich weiß nicht, wo ich meinen Kopf schlagen soll!

EDIT: Ich habe versucht, Content-Type mit einer Firefox-Plugin, um zu überprüfen - alles scheint wie erwartet kommen zu werden (ich die tatsächliche URL bin setzen, damit die Menschen einen Blick haben können):

http://wokheisandbox.appspot.com/sitemaps/sitemap.txt -> Content-type: text/plain http://wokheisandbox.appspot.com/sitemaps/sitemap.xml -> Content-type: application/xml

Mit meinem Servlet (setting text/plain explizit): http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT -> Content-type: text/plain http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML -> Content-type: text/plain

Alles, was ich vom Webmaster Tool immer noch bekomme, ist ->Sitemap ist HTML.

EDIT:

Ich glaube, ich den Grund herausgefunden -> registrierte ich auf Google Webmaster-Tool meiner Seite als http://mydomain.com aber die App ist auf AppSpot bei http://myapp.appspot.com gehostet, die auf mydomain.com abgebildet wird. Wenn ich mich registriere http://myapp.appspot.com alles funktioniert gut (Sitemap validiert).

Das sind gute Nachrichten, aber es ist nicht ideal, weil ich will, dass mydomain.com indiziert wird ... irgendeine Idee, wie man sie überwinden kann?

+0

können Sie betrachten dies auf Serverfault.com Posting auch/statt. – Travis

+0

Was ist die echte Domain? Wie machst du die Domain-Weiterleitung? –

+0

es ist alles durch Google Apps gemacht - echte Domain ist www.wokhei.com – JohnIdol

Antwort

5

Klingt wie Ihr Webserver .txt Dateien wie text/html statt text/plain dient.

Für Apache sollte die folgenden in einer .htaccess-Datei beheben:

AddType text/plain .txt 
+0

Das klingt wie eine wahrscheinliche Ursache, aber ich benutze Google App-Engine, so dass ich nicht weiß, wie man einen AddType – JohnIdol

+0

ok - ich habe es satt und habe ein Servlet implementiert, um meine Sitemaps (ich versuche es jetzt sowohl mit XML als auch mit TXT) als text/plain zu implementieren. Immer noch erhältliche XML-Sitemap. Ich weiß nicht, wo ich meinen Kopf schlagen soll! – JohnIdol

+0

Können wir Ihre Sitemap sehen? – ceejayoz

-1

ich ziemlich sicher bin, dass Sie eine XML-Sitemap-Datei formatiert (sitemap.xml) zur Verfügung stellen müssen. Hier finden Sie ein Beispiel für ein Format: http://en.wikipedia.org/wiki/Sitemaps.

+0

Nein: http://www.google.com/support/webmasters/bin/answer.py?hl=de&answer=34654#2 – ceejayoz

1

Ich fand diese thread discussing duplicate entries causing recent sitemap grief. Ich sehe dieses Problem nicht in Ihrer Sitemap, aber Sie möchten keine Duplikate zwischen den Einträgen. Zum Beispiel, stellen Sie sicher, dass Ihre Sitemap nicht beide den folgenden enthält:

http://mydomain.com/ or http://www.mydomain.com/ 

AND 

http://mydomain.com/index.html or http://www.mydomain.com/index.html 

Ich glaube, Sie Ihre gesamte Sitemap geschrieben so, wieder, ich glaube nicht, das Ihr Problem genau ist. Sie haben erwähnt, dass Sie verschiedene URLs ausprobiert haben (mit und ohne www.). Wenn Sie die Sitemap über die Google WebMaster Tools validieren, kann es bis zu 20 Minuten dauern, bis die Korrektur wirksam wird. Ich hoffe, es hilft.

+0

Vielen Dank für Ihren Beitrag - Ja, ich habe die gesamte Sitemap veröffentlicht. Ich habe alles getan, was Sie vorgeschlagen haben, und ich bin ziemlich verwirrt! – JohnIdol

+0

@JohnIdol - An dieser Stelle könnte ich vorschlagen, die Sitemap in das XML-Format zu konvertieren oder die Seitenerweiterung in .html zu ändern. Die Änderung kann einen Unterschied bei Google und/oder Hilfe machen, wenn das Problem damit zu tun hat, dass Ihr Webserver txt-Dateien bereitstellt, wie es ceejayoz vorgeschlagen hat. –

+0

versucht - kein Glück – JohnIdol

0
<?xml version='1.0' encoding='utf-8' ?> 
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'> 
    <url> 
     <loc>http://myDomain.com</loc> 
    </url> 
    <url> 
     <loc>http://myDomain.com/about.html</loc> 
    </url> 
    <url> 
     <loc>http://myDomain.com/faq.html</loc> 
    </url> 
    <url> 
     <loc>http://myDomain.com/careers.html</loc> 
    </url> 
</urlset> 

So funktioniert immer für mich.

0

Nur für den Fall, wenn Sie Ihre Meinung über Nicht-XML-Sitemaps ändern:

<?xml version="1.0" encoding="UTF-8"?> 
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
    <url> 
    <loc>http://www.test.com/</loc> 
    <lastmod>2009-08-03T23:40:40+00:00</lastmod> 
    <changefreq>daily</changefreq> 
    <priority>1.0</priority> 
    </url> 
    <url> 
    <loc>http://test/</loc> 
    <lastmod>2009-08-03T23:59:08+00:00</lastmod> 
    <changefreq>weekly</changefreq> 
    <priority>0.6</priority> 
    </url> 
</urlset> 
+0

Ich versuchte es auch - siehe bearbeiten – JohnIdol

+0

Hmmm ... Ich gebe auf. Ihr XML-Code sieht mir sehr ähnlich. Vielleicht hatten die Jungs von Google kürzlich etwas durcheinander gebracht? : D –

+0

vielleicht hast du recht .. auch scheinen sie nicht auf die Google Webmaster Tools Hilfe Forum überhaupt antworten -> http://www.google.com/support/forum/p/Webmasters/thread? tid = 70b5d81d798d3e0f & hl = de – JohnIdol