Ich habe einen Datensatz in R ähnlich einen Dummy, wie gezeigt:Ich brauche eine Ähnlichkeitsbewertung zu den Elementen in meinem Datensatz geben
Apple-3
Apple-California-4
Apple-China-3
Samsung-2
Samsung-India-2
Sony-AG-1
Sony-4
Sony-USA-4
ich sie auf einem Ähnlichkeitspunkt kombinieren muß als
Apple-10
Samsung-4
Sony-9
zB Apple, Apple-China, Apple-California
kombiniert werden in Apple
und ihre Werte werden summiert.
Gibt es eine Möglichkeit, das zu tun?
Wissen Sie, wie ein gemeinsamen Unterschlüssel in den Saiten zu identifizieren (wie in Ihrem Beispiel Apple, Samsung einfach die ersten Zeichen des Strings sind) oder Sie brauchen etwas, das automatisch diese Unterschlüssel oder sogar eine Art von Clustering von ihnen identifiziert? – digEmAll