Jag behöver få tag i stora ansamlingar text i ett enkelt maskinläsbart format till ett litet projekt jag håller på med. Allra helst på svenska, men engelska duger i nödfall.
När jag säger "massive wall of text" så menar jag textansamlingar på absolut minst 10 000 ord, helst 100 000 eller fler. En databasdump av samtliga inlägg på UM hade varit perfekt, men jag misstänker att en sådan inte existerar eftersom skiddies bara brukar bry sig om lösenordshasharna.
Någor förslag på vad jag kan få tag i detta?
Världens bästa autistiska snubbe kan nog hjälpa dig. Han använder rätt mycket nummer, jag hoppas att det inte gör något?
Spana även in hans drömjournal och liknande.
http://www.gutenberg.org/files/7178/7178-8.txt
hittade inte svenska varianten, men den finns nog som e-bok nånstans.
Leijonsparf:
hittade inte svenska varianten, men den finns nog som e-bok nånstans.
Jag vet att du bara använder just den för att du tycker att det är festligt att jag läst den.
mediakatt:
Jag vet att du bara använder just den för att du tycker att det är festligt att jag läst den.
eller för att det är en bok som i princip är känd för att den är för lång för att folk ska orka läsa den.
honolulu:
läste allt
dessutom, tyvärr bara 35 000 ord
Du är en sån där autistisk superförmåga eller? Jag bara tog nåt random, för övrigt.
Valfri random walktrough?
Dock engelska.
honolulu:
ja detta var ju betydligt fler ord... ca 123 000
inte lika spännande dock
det finns sex delar till, om inte de skulle räcka.
honolulu:
[
]
![[wink]](/img/smilies/wink.gif)
Leijonsparf:
http://www.gutenberg.org/files/7178/7178-8.txt
hittade inte svenska varianten, men den finns nog som e-bok nånstans.
Den ska in!
Mawns:
Världens bästa autistiska snubbe kan nog hjälpa dig. Han använder rätt mycket nummer, jag hoppas att det inte gör något?
Spana även in hans drömjournal och liknande.
För mycket formattering för att vara enkelt maskinläsbart, tyvärr. Anledningen till tråden är massiv copypaste-orsakad musarm. =P
Mow Skwoz:
Behöver naturlig löpande text, antingen uppdelad i stycken (dock inte för små; åtminstone ett par meningar per stycke) eller helt och hållet löpande.
Budolicious:
Valfri random walktrough?
Alldeles för lite text.
Gentlernen:
Alldeles för lite text.
Tog första bästa (zelda: oot), den var på 99527 ord. ![[sad]](/img/smilies/sad.gif)
Gentlernen:
Den ska in!
nästkommande delar går även de att hitta på gutenberg, sammanlagt 1,5 miljoner ord enligt wikipedia. borde räcka en bit.
Har du tillgång till ett svenskt exemplar av Microsoft Word?
Isåfall kan du fixa wall of text jättesimpelt. Öppna bara ett nytt dokument, klistra in "=rand (200, 99)" utan citattecken och tryck enter.
Tadaa. 300 000+ ord.
magkliarn:
Tadaa. 300 000+ ord.
syftet med det här är nog att experimentera med språk naturligt språk, tal- eller formellt. att slumpa ord hade inte krävt en tråd.
Gentlernen:
stora ansamlingar text
TELL IT (anledningen till detta. du nämnde nåt i programmeringstråden, är nyfiken.)