2016-06-07 12 views
1

Ich habe einige Daten von http://downloads.dbpedia.org/2015-04/core/, einschließlich: instance-type_en.nt, mappingbased-properties_en.nt und einige andere heruntergeladen.Heruntergeladene DBpedia-Daten enthalten nicht alle Instanztypen.

Ich habe sie erfolgreich in OpenLink Virtuoso DB geladen, aber wenn ich einige Beispiel SPARQL Abfrage, z. B. eine Abfrage, um alle Tripel über ein Thema Xiamen_University zu sehen, erscheint das Problem.

select ?s ?p ?o 
where 
    { 
    ?s rdfs:label "Xiamen University"@en . 
    ?s ?p ?o . 
    } 

Vom DBPedia SPARQL-Endpunkt gibt es heaps of triples über iamen_University; während in meinem db gibt es nur 4 oder 5 von ihnen.

Vor allem gibt es kein Triple in db zeigt Xiamen_University ist eine Art von Universität, oder jede Instanz-Typ Tripel überhaupt. Ähnliche Fälle habe ich auch bei anderen Themen gefunden.

Ich denke, die instance-types_en.nt Datei enthält nicht alle instance-types Tripel von Wikipedia, das gleiche Problem mit mappingbased-properties. Ist das richtig? Wenn ja, wo finde ich die richtige Quelldatei?

Antwort

1

Es gibt eine ganze Liste der verfügbaren Datensätze auf der downloads page. Ich sehe nicht viel Dokumentation über genau, was in jedem von ihnen ist, aber die Namen sind ziemlich beschreibend, und die Fragezeichen links neben jedem zeigen eine Vorschau dessen, welche Art von Informationen in jedem von ihnen ist. Wenn Sie über den einzelnen Titeln schweben, erhalten Sie eine kurze Beschreibung. ZB:

screenshot of tooltip

Es ist wie die meisten interessanten Eigenschaften zu erhalten sucht, dann würden Sie wahrscheinlich wollen die mappingbased Datensätze zusammen mit den Etiketten Dataset (da die Abfrage, die Sie Objekte geschrieben identifiziert durch Etikette).

+0

Wie @Joshua sagte, Mapping-basiert ist, was später im 'http: // dbpedia.org/ontology /' Namespace ist. Die meisten Daten sind jedoch nicht mapping-basiert und gehören zum Namensraum "http: // dbpedia.org/property /". Vor allem, was in den Dateien enthalten ist, deren Name mit "infobox properties" beginnt. – AKSW