2016-03-26 6 views

erstellen Ich habe das folgende HTML-Snippet. Ich möchte die Seite scrapen, um die Themen und Unterthemen zu erhalten und sie in Objekten zu speichern.Wie hierarchische Objekte mit Geschwister-Tags mit jquery Selektoren

das gewünschte Ergebnis ist etwas:

'topic': 'Java Basics', 
'subtopics':['Define the scope of variables', 'Define the structure of a Java class', ...] 

ich versucht, es mit Jsdom für Node.js und JQuery funktioniert:

var jsdom = require('jsdom'); 
var fs = require("fs"); 

var topicos = fs.readFileSync("topic.html", "utf-8"); 

    jsdom.env(topicos, ["http://code.jquery.com/jquery.js"], function (error, window) { 
     var $ = window.$; 
     var length = $('div ~ ').each(function() { 
      var topic = $(this); 
      var text = topic.text();     

aber aufgrund meiner mangelnden Erfahrung in jQuery, ich Ich bin nicht in der Lage, die Hierarchie richtig zu organisieren.


    <strong>Java Basics&nbsp;</strong></div> 
     Define the scope of variables&nbsp;</li> 
     Define the structure of a Java class 
     Create executable Java applications with a main method; run a Java program from the command line; including 
     console output. 
     Import other Java packages to make them accessible in your code 
     Compare and contrast the features and components of Java such as: 
     platform independence, object orientation, encapsulation, etc. 
    <strong>Working With Java Data Types&nbsp;</strong></div> 
     Declare and initialize variables (including casting of primitive data types) 
     Differentiate between object reference variables and primitive variables 
     Know how to read or write to object fields 
     Explain an Object's Lifecycle (creation, "dereference by reassignment" and garbage collection) 
     Develop code that uses wrapper classes such as Boolean, Double, and Integer. &nbsp;</li> 



Hier arbeitet fiddle Snippet

var topicos = []; 

var data = {}; 
var jThis = jQuery(this); 
    data.topic = jThis.find('strong').text(); 
    data.subtopics = []; 
    var jThis = jQuery(this); 


Aber ich würde empfehlen, Klassen zu Ihrem Markup hinzuzufügen und sie als Selektoren verwenden anstelle von Tag-Namen:

<div class="js-topic-data"> 
    <strong class="js-topic">Java Basics&nbsp;</strong> 
    <li class="js-sub-topic"> 
     Define the scope of variables&nbsp;</li> 

Dann könnten Sie etwas tun wie:

var data = {}; 
var jThis = jQuery(this); 
    data.topic = jThis.find('.js-topic').text(); 
    data.subtopics = []; 
    var jThis = jQuery(this); 

die etc

für Markup-Änderungen wesentlich robuster ist