2016-03-23 8 views
-6

Ich habe Daten wie unten. Ich will Zähldifferenz mit eindeutiger ID von "-HR" ID und ohne "-HR" ID. Ich habe es versucht, aber es funktioniert nichtZähldifferenz mit eindeutiger ID in R Programmierung

ID 
NCT01525641 
NCT01525641-HR 
NCT01525641 
NCT01525641-HR 
NCT01525641 
NCT01525641-HR 
NCT01525641 
NCT01525641-HR 
NCT01987557 
NCT01987557-HR 
NCT01929317 
NCT01929317-HR 
NCT01929317 
NCT01929317-HR 
NCT01782222 
NCT01782222-HR 
NCT01782222 
NCT01782222-HR 
NCT01782222 
NCT01782222-HR 
NCT01782222 
NCT01782222-HR 
NCT01782222 
NCT01782222-HR 
NCT01782222 
NCT01782222-HR 
NCT01782222 
NCT01782222-HR 
NCT01646255 
NCT01646255-HR 
NCT01634243 
NCT01634243-HR 
NCT01634243 
NCT01634243-HR 
NCT01634243 
NCT01634243-HR 
NCT01634243 
NCT01634243-HR 
NCT01631812 
NCT01631812 
NCT01631812-HR 
NCT01631812 
NCT01631812-HR 
NCT01631812 
NCT01631812-HR 
NCT01631812 
NCT01631812-HR 
NCT01628848 
NCT01628848-HR 
NCT01628848 
NCT01628848-HR 
NCT01628848 
NCT01628848-HR 
NCT01606670 
NCT01606670-HR 
NCT01606670 
NCT01606670-HR 
NCT01606670 
NCT01606670-HR 
NCT01556165 
NCT01556165-HR 
NCT01536366 
NCT01536366 
NCT01536366-HR 
NCT01536366 
NCT01536366-HR 
NCT01536366 
NCT01536366-HR 
NCT01485172 
NCT01485172-HR 
NCT01485172 
NCT01485172-HR 
NCT01485172 
NCT01485172 
NCT01485172-HR 
NCT01485172 
NCT01485172-HR 
NCT01479530 
NCT01479530-HR 
NCT01479530 
NCT01479530-HR 
NCT01467960 
NCT01361009 
NCT01361009-HR 
NCT01131494 
NCT01131494-HR 
NCT01131494 
NCT01131494-HR 
NCT01097421 
NCT01097421-HR 
NCT01097421 
NCT01097421-HR 
NCT01097421-HR 
NCT01097421 
NCT01097421-HR 
NCT01071395 
NCT01071395 
NCT01049984 
NCT01049984-HR 
NCT01049984 
NCT01049984-HR 
NCT01049984 
NCT01049984-HR 
NCT01018264 
NCT01018264-HR 
NCT01018264 
NCT01018264-HR 
NCT00988117 
NCT00988117-HR 
NCT00988117 
NCT00988117-HR 
NCT00988117 
NCT00988117-HR 
NCT00955032-HR 
NCT00955032-HR 
NCT00955032-HR 
NCT00955032-HR 
NCT00862537 
NCT00862537-HR 
NCT00761137 
NCT00761137-HR 
NCT00753519 
NCT00753519-HR 
NCT00658567 
NCT00658567-HR 
NCT00658567 
NCT00658567-HR 
NCT00515437 
NCT00515437-HR 
NCT00489255 
NCT00489255-HR 
NCT00489255 
NCT00489255-HR 

enter image description here

+3

Bitte ** [Format] (http://stackoverflow.com/help/formatting) ** Ihre Frage so ist es einfacher, Lesen Sie, und fügen Sie Ihren Code insbesondere als Text und nicht als verknüpftes Bild ein. Dies wird die Dinge viel einfacher für jeden machen, der Ihre Frage beantworten kann! – Erica

+0

Ich wurde zu einem animierten Gif für meine Antwort verlinkt, aber das ist wahrscheinlich zu snarky ... – cory

Antwort

1
require(stringr) 

# ids are all values that do not end with -HR 
ids <- unique(df$ID[!grepl("-HR$", df$ID)]) 

# HR_ids are all values that end with HR 
HR_ids <- unique(df$ID[grepl("-HR$", df$ID)]) 
# Then you can remove the last 3 characters 
HR_ids <- str_sub(HR_ids, end = -4) 

# Using setdiff, you can then obtain the difference between your two vectors 
setdiff(HR_ids, ids) # HR_ids that are not in ids 
setdiff(ids, HR_ids) # ids that are not in HR_ids 
+0

vielen Dank. aber ich möchte, wie ID \t Count \t Difference NCT00037830 Count NCT00037830-HR Count NCT00046475 Count NCT00046475-HR Count 2 – SrikanthY