2011-01-08 13 views
0

Frohes Neues Jahr alle, jetzt versuche ich, meinen eigenen Bot (web crawler) zu entwickeln, der durch das Internet für die Suchmaschine läuft. Ich denke jboss Scheduler-Service nutzen bot und so etwas zu planen Inhalt zu erhalten:Welche jBoss und EJB3 Funktionen sollte ich für Web Crawler verwenden

URL u = new URL("http://www.google.kz"); 
    InputStream in = u.openStream(); 

Ich möchte fragen, welche EJB3 oder jBoss Funktionen sollte ich effektiv zu entwickeln verwenden, um (in der richtigen Art und Weise) mein Bot ? Ich bin neu in EJB3 und jBoss.

Wenn Sie bessere Ideen haben, können Sie mit der rechten here.I entwickle Suchmaschine meine Java Fähigkeiten zu üben und in akademischen Fragen, ich bin nicht mit Google :)

  • jboss-5.1 gehen zu konkurrieren. 0.GA
  • XP
  • EJB3
  • Eclipse-helios

PS Ich habe noch nicht entschieden, wie ich html parsen werde, ich denke über so etwas nach: Parse HTML. Was kannst du empfehlen?

+0

@ Bohzo ist richtig, das sind keine relevanten Technologien für das, was Sie versuchen zu tun. Sie werden dich nicht behindern, aber sie nützen dir auch nicht viel. – skaffman

Antwort

2

Sie benötigen weder EJB noch JBoss. In der Tat kann ich kaum eine Verwendung von ihnen für einen Web-Crawler denken. Nur wenn Sie JPA zum Speichern der Ergebnisse aus dem Crawl verwenden, können Sie Container-verwaltete Transaktionen und die automatische Injektion des JPA-Entitätsmanagers verwenden. Abgesehen davon - nein.

+0

Danke, ich bin neu für EJB und jBoss, ich denke, dass es einige Funktionen gibt, die bei dieser Aufgabe hilfreich sein können. Aber ich werde auf andere Antworten warten. –