2009-08-31 3 views
9

Ich versuche std::string s in einer Gebietsschema-abhängigen Weise zu vergleichen.locale-abhängige Reihenfolge für std :: string

Für gewöhnliche C-Strings, habe ich strcoll gefunden, das ist genau das tut, was ich will, nach std::setlocale

#include <iostream> 
#include <locale> 
#include <cstring> 

bool cmp(const char* a, const char* b) 
{ 
    return strcoll(a, b) < 0; 
} 

int main() 
{ 
    const char* s1 = "z", *s2 = "å", *s3 = "ä", *s4 = "ö"; 

    std::cout << (cmp(s1,s2) && cmp(s2,s3) && cmp(s3,s4)) << "\n"; //Outputs 0 
    std::setlocale(LC_ALL, "sv_SE.UTF-8"); 
    std::cout << (cmp(s1,s2) && cmp(s2,s3) && cmp(s3,s4)) << "\n"; //Outputs 1, like it should 

    return 0; 
} 

jedoch tun, würde Ich mag auch dieses Verhalten haben für std::string. Ich konnte überlastete nur operator< so etwas wie

bool operator<(const std::string& a, const std::string& b) 
{ 
    return strcoll(a.c_str(), b.c_str()); 
} 

zu tun, aber dann müsste ich über Code kümmern mit std::less und std::string::compare, so dass es nicht richtig anfühlen.

Gibt es eine Möglichkeit, diese Art der Sortierung für Strings nahtlos zu arbeiten?

Antwort

7

operator() von std :: locale ist genau das, was Sie suchen. Um das aktuelle globale Gebietsschema zu erhalten, verwenden Sie einfach den Standardkonstruktor.

+0

Das ist praktisch. Es macht die Standardsammlungen ohne Aufwand möglich. – CAdaker

7

Die C++ - Bibliothek bietet die collate facet Locale-spezifische Sortierung zu tun.

+0

operator() am Gebietsschema ist der einfachste Weg, den ich kenne, um darauf zuzugreifen. – AProgrammer

+1

Ich sehe - ich wusste das nicht. –

0

Nach ein bisschen Suche erkannte ich, dass ein Weg, um es zu tun könnte, die Vorlage std::basic_string überladen, um eine neue, lokalisierte String-Klasse zu machen.

Es gibt wahrscheinlich eine Unmenge Bugs in diesem, sondern als ein Proof of Concept:

#include <iostream> 
#include <locale> 
#include <string> 

struct localed_traits: public std::char_traits<wchar_t> 
{ 
    static bool lt(wchar_t a, wchar_t b) 
    { 
     const std::collate<wchar_t>& coll = 
      std::use_facet< std::collate<wchar_t> >(std::locale()); 
     return coll.compare(&a, &a+1, &b, &b+1) < 0; 
    } 

    static int compare(const wchar_t* a, const wchar_t* b, size_t n) 
    { 
     const std::collate<wchar_t>& coll = 
      std::use_facet< std::collate<wchar_t> >(std::locale()); 
     return coll.compare(a, a+n, b, b+n); 
    } 
}; 

typedef std::basic_string<wchar_t, localed_traits> localed_string; 

int main() 
{ 
    localed_string s1 = L"z", s2 = L"å", s3 = L"ä", s4 = L"ö"; 

    std::cout << (s1 < s2 && s2 < s3 && s3 < s4) << "\n"; //Outputs 0 
    std::locale::global(std::locale("sv_SE.UTF-8")); 
    std::cout << (s1 < s2 && s2 < s3 && s3 < s4) << "\n"; //Outputs 1 

    return 0; 
} 

Howerver, es scheint nicht zu funktionieren, wenn Sie es auf Basis char statt wchar_t und ich habe keine Ahnung, warum ...

+0

Der Grund, warum char nicht funktioniert, ist, dass es keinen Unicode verwendet (wie in ".UTF-8". Sie verwenden wahrscheinlich ISO/IEC 8859-1.) –

+0

Was soll '& a + 1' tun? – 0x499602D2