2009-06-05 6 views
22

Wenn Sie zufällig generierte Strings oder Strings mit darin codierten Daten belichten (Product Keys). Ist es irrational, sie für Schimpfwörter zu desinfizieren, um zu vermeiden, dass der Klient in dem seltenen Fall, dass ein anstößiges Wort erzeugt wird, beleidigt wird?Ist es irrational, Zufallszeichenfolgen für Schimpfwörter zu bereinigen?

Jeder jemals einen Kunden durch einen zufällig erzeugten Schimpfwort beleidigt bekommen haben? Jeder da draußen jemals Code-Logik, um sie auszufiltern?

Dank

bearbeiten

Einmal nach einem Produktschlüssel Erzeugungssystem zu entwickeln, die in sie verschlüsselt Kundendaten hatte. Als Witz schrieben wir ein Programm, um zu sehen, welche Kundeneingaben lustige Wörter erzeugen würden.

+3

Auf den ersten Blick klingt das sicher albern. Was ist mit einem Kunden, der mit dem Namen eines Landes beleidigt ist? Manche Leute denken nicht, dass Israel existieren sollte, und gehen große Anstrengungen durch, um "The Zionist Entity" und solche Dinge zu sagen. Wie weit soll man gehen? Haben Sie zusätzliche Informationen darüber, wo oder wie die Linie gezogen wird? Sind das die sieben Wörter, die man nicht auf der Fernsehliste sagen kann? –

+2

Ich wäre gespannt, ob es ein einheitliches Verfahren gibt, nach "obszönen" Buchstabenkombinationen auf Nummernschildern zu suchen. Es scheint, als könnten Sie einen ähnlichen Algorithmus verwenden. –

+0

Die Chancen, ein bestimmtes 4-Buchstaben-Wort zufällig zu generieren, sind wie 1 zu einer halben Million. –

Antwort

33

nicht generieren zufällige Zeichenfolge mit Vokalen und dann muss man nicht über Schimpfwörter kümmern.

+2

Tolle Idee.Sollte in den meisten Sprachen auch funktionieren. – Laserallan

+11

Während ich generell stimme, könnten Sie immer noch mit Strings wie "fck" oder "fvck" enden. Dies fällt wahrscheinlich immer noch unter "Optimiere nicht für Wahnsinnige". – luke

+4

@luke: Ja, ich denke, dass diese Methode die "echten" Schimpfwörter loswerden wird. Imagined oder "sieht irgendwie wie ein Schimpfwort aus, wenn Sie wirklich hart schielen" Wörter sind immer noch das Problem des Benutzers :) – CloudyMusic

27

Ja, mit der Begründung, dass jeder, der durch etwas beleidigt würden sie in einem zufällig erzeugten Zeichenfolge sah von mehr Dinge denken, sie können finden Offensive, als Sie sanieren können.

Nicht für die Wahnsinnigen optimieren.

0

Es ist sicher denkbar, aber ich würde viel Zeit, um es nicht widmen, vor allem, wenn Sie bekam Buchstaben und Zahlen haben.

1

Grenze Ihre zufällig generierten „Wörter“ auf Hex-Zeichen und ich glaube nicht, dass Sie keine englischsprachigen Flüche haben werden. Dies schiebt Sie auch den Weg, nicht zu viel Zeit mit Ihrem zufälligen Wortgenerator zu verbringen.

Natürlich kann es eine gewisse Sprache, wo man mit hexadezimalen Ziffern verfluchen, aber dann sind Sie wahrscheinlich nicht, diese Flüche ohnehin wissen/filtern.

+2

Nun, fec e00 2. – chaos

+1

0xdeadbeef, 0xaffe (Deutsch für "Affe") . –

+5

totes Rindfleisch?!?! Als Vegetarier bin ich sehr beleidigt. – Aardvark

4

Das macht für mich Sinn. Ich meine, wäre es eine ziemlich schlechte PR Katastrophe, wenn jemand ein Bild von Ihrem Produkt, mit diesem auf der Rückseite der CD-Hülle gestempelt Beiträge:

12.345-67.890-F ** KU-ABCDE-FGHIJ

Es hört sich witzig an, aber man weiß nie, welche Art von Humor der Mensch haben wird, der das Paket abholt.

+0

Dies ist auch nicht nur eine hypothetische. Es ist wirklich passiert, mit einem Kohl Patch Puppe: http://www.clickondetroit.com/news/4050844/detail.html –

+0

Oberhalb der Verbindung gebrochen. Siehe https://web.archive.org/web/20090116040027/https://www.clickondetroit.com/news/4050844/detail.html – SophiaAP

1

Wenn Sie nur Sorgen um Produktschlüssel sind, würde ich zu hexadezimalen Ziffern bleiben, vielleicht sogar ein guid für Sie arbeiten würde. Wahrscheinlich keine Chance, dass ein "ungezogenes" Wort mit diesen Einschränkungen erzeugt wird. Sie könnten auch einfach bei Zahlen bleiben. Wenn Sie zufällige Zeichenfolgen mit allen Buchstaben des Alphabets haben müssen, ist es wahrscheinlich sicherer als Nachsicht, also würde ich die Filterung machen.

+0

Aus meiner Kindheit -> 1134 40 – EvilTeach

+0

Oh Hölle, die 4s rendern nicht wie es sein muss. – EvilTeach

2

diese Elemente mit clbuttic

+0

Verdammt, jemand tötete diese Tags, versuchen Sie eine Suche: http://stackoverflow.com/search?q=clbuttic –

0

markiert sehen, ich bin zufällig generierte verwenden, Laut klingender Passwörter für ein Webapp schrieb ich. Ich habe am Ende eine Liste mit "schmutzigen" Wörtern geschrieben, die nicht akzeptabel sind, aber die Liste, die meinem Muster entsprach, war ziemlich kurz.

0

Nein. Sie haben keine Chance, alle Schimpfwörter in allen Weltsprachen zu sammeln. Diese Wörter erscheinen normalerweise nicht in Wörterbüchern.

+1

Ein gutes Wörterbuch wird Umgangssprache und Slang enthalten. Die OED enthält sicherlich Flüche und alle anderen Arten von Schmutz, die meine Vorfahren schämen würden, dies wöchentlich zu tun. –

6

Die einfachste Lösung besteht darin, aus einem 'sanitizierten' Alphabet zu generieren; Verwenden Sie eine Reihe von Zeichen, die möglicherweise keine Wörter bilden können.Ein Vorschlag in einer der Antworten ist hexadezimal, was eine ausgezeichnete Wahl ist, oder sonst einige kritische Buchstaben aus dem Alphabet fallen lassen.

Beachten Sie, dass nur das Ablegen von Vokalen die Aufgabe nicht erledigen wird ... es ist allzu einfach, sie von den restlichen Konsonanten abzuleiten.

2

Ich denke, es ist besser, einfach Vokale zu vermeiden. Ein Produktschlüssel wie JKL-YOARAREMYFRIEND-0001-KK mag nicht beleidigend sein, aber es klingt auch nicht nach seriöser Geschäftspolitik.

1

Wir sind ein zufälligen Zeichenfolge Generator für einen Sicherheitsschlüssel, die an Kunden gesendet werden, und taten nicht Vokale aus den zulässigen Zeichen weglassen, usw. Kein Wort der Lüge, eine der Saiten war es erzeugt " 7D9WAF * CKS "...! Zum Glück wurde dies während der Entwicklung entdeckt, und wir werden nun die zulässigen Zeichen beschränken. Wütend!! Das war knapp - glücklich, diesen Beitrag gefunden zu haben!

1

Ein sehr Spaß tale of woe mit einer ähnlichen Situation zu lesen.

2

Microsoft läßt die folgende von ihrem Produktschlüssel:

0 1 2 5 A E I O U L N S Z

Ich lasse die aus [0-9A-Z], und sobald der Schlüssel erzeugt wird, ich passe gegen a list I found von Zweibuchstabenkombinationen am häufigsten in Englisch, und den Schlüssel neu generieren, wenn es eine Übereinstimmung gibt. Für die Geschwindigkeit bearbeite ich die Liste der Buchstabenpaare, indem ich zuerst aus dieser Liste die Paare ausschließe, die bereits aufgrund der Aufnahme eines Zeichens in die entfernte Liste verhindert sind ('HE' kann nicht existieren, wenn der Schlüssel aus einem Zeichensatz generiert wird) das nicht "E" enthält, dann einige von "E" in "3" umwandeln, wie in "H3" anstelle von "HE" usw. Ich habe auch ein paar eigene hinzugefügt, wie "KK" und " CK 'für Randfälle. Man könnte auch "3" für die Geschwindigkeit weglassen, wie es notwendig ist, obwohl mehr Zeichen, die Sie weglassen, die weniger eindeutigen Schlüssel erzeugt werden können.

Wahrscheinlich keine perfekte Lösung, aber es ist schnell genug für meine Bedürfnisse und verhindert, dass fast alle englischen Wörter erzeugt werden, beleidigend oder nicht.