Für Ihre kleineren Beispiel mit einer begrenzten Vielfalt von Elementen, können Sie einen Satz verwenden können und ein dict Verständnis:
>>> mylist = [1,1,1,1,1,1,2,3,2,2,2,2,3,3,4,5,5,5,5]
>>> {k:mylist.count(k) for k in set(mylist)}
{1: 6, 2: 5, 3: 3, 4: 1, 5: 4}
zu brechen es down, set(mylist)
unifiziert die Liste und macht es kompakter:
>>> set(mylist)
set([1, 2, 3, 4, 5])
Dann schreitet das Wörterbuchverständnis durch die eindeutigen Werte und setzt die Zählung aus der Liste.
Dies ist auch deutlich schneller als Zähler verwendet und schneller als setdefault mit:
from __future__ import print_function
from collections import Counter
from collections import defaultdict
import random
mylist=[1,1,1,1,1,1,2,3,2,2,2,2,3,3,4,5,5,5,5]*10
def s1(mylist):
return {k:mylist.count(k) for k in set(mylist)}
def s2(mlist):
return Counter(mylist)
def s3(mylist):
mydict=dict()
for index in mylist:
mydict[index] = mydict.setdefault(index, 0) + 1
return mydict
def s4(mylist):
mydict={}.fromkeys(mylist,0)
for k in mydict:
mydict[k]=mylist.count(k)
return mydict
def s5(mylist):
mydict={}
for k in mylist:
mydict[k]=mydict.get(k,0)+1
return mydict
def s6(mylist):
mydict=defaultdict(int)
for i in mylist:
mydict[i] += 1
return mydict
def s7(mylist):
mydict={}.fromkeys(mylist,0)
for e in mylist:
mydict[e]+=1
return mydict
if __name__ == '__main__':
import timeit
n=1000000
print(timeit.timeit("s1(mylist)", setup="from __main__ import s1, mylist",number=n))
print(timeit.timeit("s2(mylist)", setup="from __main__ import s2, mylist, Counter",number=n))
print(timeit.timeit("s3(mylist)", setup="from __main__ import s3, mylist",number=n))
print(timeit.timeit("s4(mylist)", setup="from __main__ import s4, mylist",number=n))
print(timeit.timeit("s5(mylist)", setup="from __main__ import s5, mylist",number=n))
print(timeit.timeit("s6(mylist)", setup="from __main__ import s6, mylist, defaultdict",number=n))
print(timeit.timeit("s7(mylist)", setup="from __main__ import s7, mylist",number=n))
Auf meinem Rechner, die Drucke (Python 3):
18.123854104997008 # set and dict comprehension
78.54796334600542 # Counter
33.98185228800867 # setdefault
19.0563529439969 # fromkeys/count
34.54294775899325 # dict.get
21.134678319009254 # defaultdict
22.760544238000875 # fromkeys/loop
Für größere Listen, wie 10 Millionen Integer, mit mehr verschiedenen Elementen (1.500 zufällige Ints), verwenden defaultdict oder fromkeys in einer Schleife:
from __future__ import print_function
from collections import Counter
from collections import defaultdict
import random
mylist = [random.randint(0,1500) for _ in range(10000000)]
def s1(mylist):
return {k:mylist.count(k) for k in set(mylist)}
def s2(mlist):
return Counter(mylist)
def s3(mylist):
mydict=dict()
for index in mylist:
mydict[index] = mydict.setdefault(index, 0) + 1
return mydict
def s4(mylist):
mydict={}.fromkeys(mylist,0)
for k in mydict:
mydict[k]=mylist.count(k)
return mydict
def s5(mylist):
mydict={}
for k in mylist:
mydict[k]=mydict.get(k,0)+1
return mydict
def s6(mylist):
mydict=defaultdict(int)
for i in mylist:
mydict[i] += 1
return mydict
def s7(mylist):
mydict={}.fromkeys(mylist,0)
for e in mylist:
mydict[e]+=1
return mydict
if __name__ == '__main__':
import timeit
n=1
print(timeit.timeit("s1(mylist)", setup="from __main__ import s1, mylist",number=n))
print(timeit.timeit("s2(mylist)", setup="from __main__ import s2, mylist, Counter",number=n))
print(timeit.timeit("s3(mylist)", setup="from __main__ import s3, mylist",number=n))
print(timeit.timeit("s4(mylist)", setup="from __main__ import s4, mylist",number=n))
print(timeit.timeit("s5(mylist)", setup="from __main__ import s5, mylist",number=n))
print(timeit.timeit("s6(mylist)", setup="from __main__ import s6, mylist, defaultdict",number=n))
print(timeit.timeit("s7(mylist)", setup="from __main__ import s7, mylist",number=n))
Drucke:
2825.2697427899984 # set and dict comprehension
42.607481333994656 # Counter
22.77713537499949 # setdefault
2853.11187016801 # fromkeys/count
23.241977066005347 # dict.get
15.023175164998975 # defaultdict
18.28165417900891 # fromkeys/loop
Sie können sehen, dass Lösungen, die auf count
mit einer moderaten Anzahl von Malen durch die große Liste Relais werden im Vergleich zu anderen Lösungen schlecht/katastrophal leiden.
'collections.Counter', in Ihrem Code benötigen Sie:' mydict [index] + = 1' –
Könnte ich bitte ein Beispiel fragen? danke im voraus –
'sammlungen.Zähler (meine liste)' und du bist fertig. (Nun, abgesehen von dem Importieren von 'Sammlungen', und Sie müssen immer noch tun, was auch immer Sie mit den Zählungen tun würden, aber' Sammlungen.Zähler (Meine Liste) 'ist die gesamte" Dinge zählen "-Phase.) – user2357112