2015-12-31 17 views
5

Ich möchte JSON-LD für SEO-Zwecke verwenden, aber nicht sicher, wie verhindert werden kann, dass ein automatisierter E-Mail-Harvester die Adresse (n) von der Quelle abruft.Kann JSON-LD vor E-Mail-Harvestern geschützt werden?

In der email schema geben Sie eine E-Mail-Adresse an. Ich habe immer die E-Mail-Adressen verschleiert, indem ich entweder JS verwendet habe, um sie anzuzeigen, oder andere Methoden. Dies hat bisher dazu beigetragen, Spam zu stoppen.

<script type="application/ld+json"> 
{ 
    "@context": "http://schema.org", 
    "@type": "Person", 
    "address": { 
    "@type": "PostalAddress", 
    "addressLocality": "Seattle", 
    "addressRegion": "WA", 
    "postalCode": "98052", 
    "streetAddress": "20341 Whitworth Institute 405 N. Whitworth" 
    }, 
    "colleague": [ 
    "http://www.xyz.edu/students/alicejones.html", 
    "http://www.xyz.edu/students/bobsmith.html" 
    ], 
    "email": "mailto:[email protected]", 
    "image": "janedoe.jpg", 
    "jobTitle": "Professor", 
    "name": "Jane Doe", 
    "telephone": "(425) 123-4567", 
    "url": "http://www.janedoe.com" 
} 
</script> 

Die einzige Art, wie ich es zu tun einfiel JS verwendet dynamisch die oben zu schaffen, die ich erwarten würde Mähdrescher nicht in der Lage sein, zu interpretieren zum größten Teil, dann aber das würde höchstwahrscheinlich Pause Suchmaschinenunterstützung. Gibt es dafür eine Lösung?

Antwort

4

Sofern Sie den bösartigen Bot nicht finden (und ihm eine Version ohne die E-Mail-Adresse anbieten), gibt es keine vernünftige Lösung. Einer der Hauptgründe für die Verwendung strukturierter Daten besteht darin, Bots einen einfachen Zugriff zu geben.

Sie könnten versuchen, die E-Mail-Adresse schwerer zu machen bekommen:

  • Schema.org der email property erwartet Text als Wert, so könnte Verschleierung verwendet werden (beispielsweise jane-doe at {this domain}).
    Hoffnung: Bots verstehen Ihre Verschleierungsmethode standardmäßig nicht.

  • Wenn die Verwendung der Eigenschaft email von Schema.org nicht erforderlich ist: FOAFs mbox_sha1sum property erwartet eine SHA1-Hash-E-Mail-Adresse.
    Hope: Bots versuchen nicht (oder nicht schon) die entsprechende E-Mail-Adresse zu finden.

  • Sie können JavaScript verwenden, um die email-Eigenschaft (z. B. Google supports it) hinzuzufügen.
    Hoffnung: Bots führen JavaScript nicht aus.

Aber das macht es schwieriger für gute Bots natürlich auch, und an einem bestimmten Punkt möchten Sie vielleicht die E-Mail-Adresse überhaupt nicht berücksichtigen bieten.

Wenn Sie bestimmten Kunden nur die E-Mail-Adresse mitteilen möchten, können Sie diesen Benutzern das Dokument mit der E-Mail-Adresse und alle anderen Bots ohne E-Mail-Adresse bereitstellen. Aber Suchmaschinen-Bots might not like this method. Und Sie benachteiligen neue Verbraucher oder Verbraucher, die Sie nicht kennen.

Ich würde nur die E-Mail-Adresse unverschleiert und für alle, making the life of visitors (humans as well as bots) easier. Spam sollte dein Problem sein, nicht ihr; und es ist ein Problem, das behandelt werden kann.

1

JSON-LD stellt Daten für Roboter bereit, einschließlich E-Mail-Harvester, die die Identität anderer Bots leicht verfälschen können. Ich schlage vor, die E-Mail-Adressen aus dem JSON-LD herauszulassen, es wird der SEO nicht schaden und Besitzer dieser E-Mails werden Sie dafür lieben. Andernfalls werden Ihre E-Mail-Boxen als Ziel für Spam-Nachrichten festgelegt.