2016-04-28 10 views
0

Ich habe eine Zeichenfolge, die eine Beschreibung eines RSS-Elements enthält, das ich analysiert habe. Diese Zeichenfolge enthält die Beschreibung (auf Hebräisch), eine Bild-URL und ein paar andere Zeichen, die ich nicht benötige.Extract 2 Teilzeichenfolge in verschiedenen Sprachen aus Zeichenfolge

Ich suche nach einer Möglichkeit, die Beschreibung und die URL in 2 neue Zeichenfolgen zu extrahieren.

Soweit die URL geht, habe ich eine Lösung gefunden, die gut für mich funktioniert. Da jedoch die Lage und Länge der Beschreibung Teil innerhalb des übergeordneten unbekannt ist, bin ich irgendwie damit stecken ...

** Eine Idee, die ich habe und versuchen, herauszufinden, wie man richtig kodieren:

String parent; 
for (int i = 0; i < parent.length; i++) { 
char currentChar = parent.charAt(i); 
// check if the Char is in Hebrew and remove any other Char 
} 

Doch diese Idee problematisch ist, dass da neben Hebräisch, ich muss auch mehrsprachige Zeichen (dh Zahlen, Punkte, Kommas, Anführungszeichen und andere) speichern.

Hier sind ein paar Beispiele für die Saite: (es zum Teil in Hebräisch ist, so dass ich entschuldige mich, wenn er unlesbar sein sollte)

"במשטרה חושדים כי פיודור בייז'ניריי הצליח לרצוח ולאנוס ללא חשדות נגדו<p><img src=\"http:\/\/images.nana10.co.il\/upload\/mediastock\/img\/11\/0\/258\/258180.jpg\" alt=\"\" title=\"\"\/><\/p> 

<p style=\"direction:rtl; clear:both\">\t\t\t <a href=\"http:\/\/news.walla.co.il\/item\/2956715\"> <img hspace=5 border=0 align=\"right\" src=\"http:\/\/msc.wcdn.co.il\/archive\/2132766-18.jpg\" \/> <\/a> <BR> \n\t\t\tלוחמי משמר הגבול מצאו במהלך סיור באחת משכונות מזרח ירושלים כלב פצוע שעורר את חשדם. הם פינו את הכלב לטיפול במרפאה וטרינרית שם התברר כי הוא נגנב למטרת שימוש בקרבות כלבים. בעלי הכלב: \"אנחנו עדיין לא מעכלים שהוא חזר אלינו\"<\/p> 

"הערב בחדשות: גילויים חדשים סביב מעצרו של מי שבמשטרה מכנים \"הרוצח הסדרתי\"; במרחק נגיעה מחיזבאללה - כתבנו במוצב הרגיש בצפון; ניצחונות סוחפים לטראמפ וקלינטון; בניגוד לחוק: בתי אבות מסרבים לקבל אליהם נשא של נגיף ה- HIV ; חשופים בדרכים: פרצת אבטחה מאפשרת לעקוב אחריכם כשאתם נוהגים עם וויז. כיצד מתגוננים?<p><img src='http:\/\/img.mako.co.il\/2016\/04\/28\/638671_A.jpg'\/><\/p> 

גרושתו של פיודור בייז'נרי: \"ישנו באותה מיטה, הוא לא עשה את זה\" 

Antwort

0

UPDATE: Also ich herausgefunden, dass alles, was ich tun musste, Streifen alles HTML-Komponenten aus der Zeichenfolge und das war es.

Verwenden Sie einfach this answer!