2016-05-23 6 views
0

Ich benutze Really Simple Traffic Logger, um Datum, Zeitstempel, IP und besuchte Seite von Benutzern auf meiner Website zu speichern. Jeder Benutzer den Besuch der Website wird eine UID durch einen Parameter in der URL in der Form zugeordnet:Excel zum automatischen Entfernen von Duplikaten vor der Summe in CSV basierend auf URL-Parameter

"DATE","TIME","IP","LOOKING_FOR" 
"2016-05-22","07:30:40","XX.XX.XX.XX","/site.php?=dTM_c1_uid7" 
"2016-05-22","07:31:10","XX.XX.XX.XX","/site.php?=dTM_c1_uid7" 
"2016-05-22","07:31:19","XX.XX.XX.XX","/site.php?=dTM_c1_uid8" 

die Informationen in einem CSV- gespeichert ist:

http://www.domain.com/site.php?=dTM_c1_uid7 

dTM = customer, 
c1 = category 1, 
uid7 = uid for person 7 

der CSV-Datei die folgende gespeicherte enthält Datei, wo ich versuche, die Ergebnisse der Daten zu summieren, die von einem anderen Skript in Echtzeit visualisiert werden sollen. Da jedoch viele der Besucher dieselben Personen sind, die die Website mehr als einmal besuchen, möchte ich diese vor dem Berechnen der Summe basierend auf dem UID-Parameter in der URL entfernen, so dass jeder Zählwert (Treffer) als eindeutige Treffer berechnet werden kann .

Ich versuche daher, eine Formel zum automatischen Entfernen von Duplikaten, die den Parameter "_uid7" enthält, vor der Berechnung der Summe zu erarbeiten.

Gibt es eine intelligente Methode zum Erstellen einer Formel in Excel, die das automatisch tun kann?

Vielen Dank.

+0

Ich habe eine Formel für die Verarbeitung der Daten in der Antwort vorgeschlagen. Ich bin gespannt, ob ich Ihre Anforderungen richtig verstanden habe. – skkakkar

Antwort

1

Nimmt man Ihre Daten geht von A1 Bitte senden Sie die folgende Formel in B1 und füllen Sie die column B mit Daten in column A

=TRIM(SUBSTITUTE(MID(A1,(SEARCH("dTM_c1_",A1,1)+7),99),CHAR(34),REPT(CHAR(32),99))) 

Sie erhalten uid7, uid8 usw., die oder eine andere Verarbeitung gezählt werden kann getan werden kann, . Screenshot for csv datascreenshot for csv data2

EDIT Basierend auf Ihre Kommentare und unter "dTM_c1_uidnn.." String zählt des Auftretens wird in den folgenden Snapshots dargestellt. Ich habe zwei Schnappschüsse gezeigt, aus denen man die Helfersäule ausblendet.

snapshot1snapshot2

Dies ist das Beste, was ich im Moment tun konnte. Spalte B kann entweder mit nativen Excel-Duplizierungen oder mit einer VBA-Routine gefiltert werden. Einzigartige Werte numerischer Werte zu finden, ist mit Frequency Function relativ einfach. Aber irgendwie konnte ich trotz wiederholter Versuche trotz einiger Tutorials nicht die gewünschten Ergebnisse für Textstrings erzielen. Ich würde es begrüßen, wenn Ihr Feedback positiv oder negativ ist. Meine Bemühungen würden weiterhin die optimale Lösung finden.

+0

skkakkar, danke für deine Antwort. Es ist sehr geschätzt. Ich muss jeden String nur einmal zählen, wenn er eine bestimmte UID enthält, z. /site.php?=dTM_c1_uid7 sollte nur einmal gezählt werden, auch wenn es mehr als einen Treffer gibt. Ich habe auf eine Formel gehofft, die die gesamte Liste durchschaut und nur diejenigen mit einer eindeutigen UID zählt. Ist das möglich? Der Grund ist, dass ich die dTM und _c1 basierend auf den eindeutigen UIDs zählen muss, aber mit mehr als einem Eintrag für jede UID, wird es die Statistiken durcheinander bringen. – user3926924

+0

vielleicht sollte ich erwähnen, dass die gesamte Zeile nur einmal mit der eindeutigen UID gezählt werden sollte. – user3926924

+0

@ user3926924 In jedem Fall muss ein Teil der Zeichenkette extrahiert werden, um eindeutige IDs zu zählen. Was repräsentiert Ihre eindeutige ID-Zeichenfolge? Ist es uidnn oder sind es andere Daten? Aus Ihren Beispieldaten ist ersichtlich, dass dTM und c1 gebräuchlich sind, daher habe ich uid mit seiner Nummer gewählt, die beliebig lang sein kann.Diese Annahme ist ok Wenn dTM für alle Enteries gleich bleibt und c1 auch nicht variiert. Wenn dieser Teil variiert und Teil einer eindeutigen ID ist, kann dieser Teil zum Zählen extrahiert werden. Einziges zählen ist kein großes Problem. Jede geeignete Formel oben auf dieser vorbereitenden Arbeit gibt Ergebnisse – skkakkar