Frohes Neues Jahr alle, jetzt versuche ich, meinen eigenen Bot (web crawler) zu entwickeln, der durch das Internet für die Suchmaschine läuft. Ich denke jboss Scheduler-Service nutzen bot und so etwas zu planen Inhalt zu erhalten:Welche jBoss und EJB3 Funktionen sollte ich für Web Crawler verwenden
URL u = new URL("http://www.google.kz");
InputStream in = u.openStream();
Ich möchte fragen, welche EJB3 oder jBoss Funktionen sollte ich effektiv zu entwickeln verwenden, um (in der richtigen Art und Weise) mein Bot ? Ich bin neu in EJB3 und jBoss.
Wenn Sie bessere Ideen haben, können Sie mit der rechten here.I entwickle Suchmaschine meine Java Fähigkeiten zu üben und in akademischen Fragen, ich bin nicht mit Google :)
- jboss-5.1 gehen zu konkurrieren. 0.GA
- XP
- EJB3
- Eclipse-helios
PS Ich habe noch nicht entschieden, wie ich html parsen werde, ich denke über so etwas nach: Parse HTML. Was kannst du empfehlen?
@ Bohzo ist richtig, das sind keine relevanten Technologien für das, was Sie versuchen zu tun. Sie werden dich nicht behindern, aber sie nützen dir auch nicht viel. – skaffman