2009-05-14 10 views
1

Ich möchte eine Datei der 200-1000 oder am häufigsten verwendeten Wörter in der englischen Sprache. Ich konnte lächerliche Listen von 200.000 Wörtern oder was auch immer finden, aber nichts mit einem kleineren Satz der häufiger verwendeten Wörter.Auf der Suche nach einer .txt Worthäufigkeitsliste zum Testen eines Programms

Vorzugsweise würde die Wörter eine pro Zeile sein, aber wenn es nicht ist, dann kann ich es formatieren.

DANKE!

+5

Könnten Sie nicht einfach ein kleines Programm schreiben, um die 200-1000 häufigsten Einträge aus einer dieser riesigen Listen auszuwählen? –

+0

Diese müssen jedoch existieren ... Ich werde mich weiter umschauen, bevor ich mich auf eine solche Aufgabe einlasse. – cksubs

+1

@ cksubs, sollte es nicht zu schwer sein, meine Antwort zeigt, was (!) Eine funktionierende Lösung sein sollte. – UnkwnTech

Antwort

0

Hier ist die Top-250 (Sie betonte, weniger ist mehr) von McWafflestix den Link, gerade nach oben, keine Fremdflächen, etc, auch dank Emacs-Rechteck zu töten. Ich muss sagen, das ist ziemlich trivial und nicht programmierungsbezogen.

the 
of 
to 
and 
a 
in 
is 
it 
you 
that 
he 
was 
for 
on 
are 
with 
as 
I 
his 
they 
be 
at 
one 
have 
this 
from 
or 
had 
by 
hot 
but 
some 
what 
there 
we 
can 
out 
other 
were 
all 
your 
when 
up 
use 
word 
how 
said 
an 
each 
she 
which 
do 
their 
time 
if 
will 
way 
about 
many 
then 
them 
would 
write 
like 
so 
these 
her 
long 
make 
thing 
see 
him 
two 
has 
look 
more 
day 
could 
go 
come 
did 
my 
sound 
no 
most 
number 
who 
over 
know 
water 
than 
call 
first 
people 
may 
down 
side 
been 
now 
find 
any 
new 
work 
part 
take 
get 
place 
made 
live 
where 
after 
back 
little 
only 
round 
man 
year 
came 
show 
every 
good 
me 
give 
our 
under 
name 
very 
through 
just 
form 
much 
great 
think 
say 
help 
low 
line 
before 
turn 
cause 
same 
mean 
differ 
move 
right 
boy 
old 
too 
does 
tell 
sentence 
set 
three 
want 
air 
well 
also 
play 
small 
end 
put 
home 
read 
hand 
port 
large 
spell 
add 
even 
land 
here 
must 
big 
high 
such 
follow 
act 
why 
ask 
men 
change 
went 
light 
kind 
off 
need 
house 
picture 
try 
us 
again 
animal 
point 
mother 
world 
near 
build 
self 
earth 
father 
head 
stand 
own 
page 
should 
country 
found 
answer 
school 
grow 
study 
still 
learn 
plant 
cover 
food 
sun 
four 
thought 
let 
keep 
eye 
never 
last 
door 
between 
city 
tree 
cross 
since 
hard 
start 
might 
story 
saw 
far 
sea 
draw 
left 
late 
run 
don't 
while 
press 
close 
night 
real 
life 
few 
stop 
1

Ich suchte Google nach "englischen Wörtern nach Häufigkeit" und fand eine Reihe von guten Quellen. Hier ist eine on wiktionary.org.

1

Here ist die Top 500. Sie können wahrscheinlich die Liste aus dem HTML auskratzen.

0

Eine einfache Lösung könnte geschrieben werden, das ist nicht getestet, sollte aber 99% gut sein.

<?php 
$fh = fopen('http://domain.tld/path/tofile.txt', 'r'); 
$wordList = array(); 
for($i=0;$i<100;$i++) 
    $wordList[] = fread($fh, 1024); 
print_r($wordList); 
?>