Ich versuche ein Skript zu schreiben, das eine Reihe grundlegender HTML -Tabellen beschreibt, die bestimmte Variationen bestimmter Wörter in verschiedenen Ländern in einer funktionierenden Tabelle für die Verwendung in einer Datenbank beschreiben. Jede Tabelle gilt für die Übersetzungen eines einzelnen Wortes über Ländergrenzen hinweg. In html nimmt es das Format:Regex-Skript zum Schreiben von Daten aus einer Tabelle in eine Tabellenkalkulation
<h5><a name="akas"> equivalent names in different countries </a> </h5>
<table border="0" cellpadding="2">
<tr>
<td>character string </td>
<td> country name/country name/country name</td>
</tr>
<tr>
<td>character string </td>
<td>country name</td>
</tr>
.................. dieses Format wird fortgesetzt, bis der Tisch
</table>
endet
Länderbezeichnungen wiederholen sich in Tabellen und sollten Spaltenüberschriften in der Tabelle darstellen, über die die Zeilen mit den entsprechenden Wörtern liegen. Ich bin total neu in Regex (was ich wirklich verwirrend finde) und auch Anfänger in Javascript. Wiederum suche ich nach Hilfe, wie man diese Art von Daten in eine funktionierende Tabelle für die Verwendung in einer größeren Datenbank umordnen kann. Wenn mir jemand helfen könnte, wäre es sehr geschätzt.
also, was ist die Frage? – Kashyap
die Frage ist, wie würde ich ein Skript Ländernamen zwischen der erkennen, auch wenn es mehrere Länder wie im obigen Beispiel und den vorhergehenden Inhalt von td (die Textzeichenfolge) in der richtigen Zelle unter der Spalte des entsprechenden Landes. – user1309067
Sie können ein sed-Skript schreiben, um daraus Daten zu extrahieren und eine CSV-Datei zu erstellen. – Kashyap