2016-07-12 10 views
-1

Ich versuche, hebräisch rss wie diese zu analysieren: http://rss.walla.co.il/?w=/3/0/12/@rss.econvert rss Codierung von Windows 1255 bis utf 8 Knoten js

Ich verwende feedparser und Anfrage, und das Problem ist, dass die Codierung ist Windows-1255 und nicht UTF-8

so sehe ich den Text wie: , und nicht wie ein normaler hebräischer Text.

Ich versuchte einige Konvertierungen (wie iconv-lite), aber ich war nicht erfolgreich.

Dies ist mein Code:

function getAll(URL) { 
var request = require('request'); 
request(URL, function (error, response, body) { 
    if (!error && response.statusCode == 200) { 
     var allXML = body.substring(body.indexOf('<title>') + ('<title>').length, body.indexOf('</title>')); 
     var text = iconv.decode(new Buffer(allXML), 'win1255'); 
     console.log("text = ", text); 
    } 
}) 

}

und das ist, was es Druck: text = ן¿½ן¿½ן¿½ן¿½ן¿½! ן¿½ן¿½ן¿½ן¿½ן¿½ - ן¿½ן¿½ן¿½ן¿½ן¿½

Antwort

0

Sie ein Modul wie iconv oder iconv-lite verwenden können zwischen Codierungen zu konvertieren, zur Zeit, da nur Knoten nativ unterstützt UTF-8, utf16le, latin1/binary, ascii, hex und base64.

0

benutzte ich diese Quelle: github

function getText(URL) { 
http.get(URL, function(res) { 
    var chunks = []; 
    res.on('data', function(chunk) { 
     chunks.push(chunk); 
    }); 
    res.on('end', function() { 
     var decodedBody = iconv.decode(Buffer.concat(chunks), 'win1255'); 
     console.log(decodedBody); 
    }); 
}); 

}