Ich hoffe, Scrapy zu verwenden, um durch STIX-Dokumente zu gehen, die Dokumente im Grunde wie einen RSS-Feed aufzustellen und dann durch sie zu "scrapen". Derzeit verwende ich nur Ipython und Scrapy Shell, um die XPaths zu bekommen.Verwenden Sie xpath und scrapy, um durch STIX-Dateien zu gehen?
<FileObj:Hashes>
<cyboxCommon:Hash>
<cyboxCommon:Type condition="Equals" xsi:type="cyboxVocabs:HashNameVocab-1.0">MD5</cyboxCommon:Type>
<cyboxCommon:Simple_Hash_Value condition="Equals">C71F2F84500E6AE4485C967F72BB9E52</cyboxCommon:Simple_Hash_Value>
</cyboxCommon:Hash>
</FileObj:Hashes>
Ich habe ‚scrapy‘ auf der Seite beschossen und ich versuche, die MD5-Hash C71F2F84500E6AE4485C967F72BB9E52 zu ziehen, alle MD5 ist auf der Seite werden wie diese aufgeführt.
Das ist, was ich habe, aber ich kann es nicht zur Arbeit kommen -
response.xpath("//cyboxCommon:Simple_Hash_Value[@condition="Equals"]/text()").extract()
unten bearbeitet -
response.xpath("//*[@condition='Equals']/text()").extract()
das mir alle Text danach gibt, nicht nur md5 aber andere STIX-Infos, die nah sind, aber immer noch nicht funktionieren. Ich bin mir nicht sicher, ob das etwas mit dem Doppelpunkt in den Namen zu tun hat.
Ich würde mich über Vorschläge freuen, danke !!!
Ich fange nur eine neue Frage für das letzte an. – Dpitt1968