Saturday, 26 January 2013
Digitalisering och dess utmaningar
Vid senaste föreläsning 24.01. diskuterade vi digitalisering av texter och annan media. Att kunna sprida gammal text i digital form över hela internet är en möjlighet som öppnar nya dörrar för all slags forskning. Det finns dock vissa saker att ta i betraktande vid användning av digitaliserat material och också om vi lägger ut sådant på nätet.
Allt som gäller copyright berörs av den ökända upphovsrättslagen. Redan på lågstadienivå kommer vi i kontakt med denna lag, eftersom de flesta läroböcker strängt förbjuder kopiering av dess innehåll. Upphovsrätten gäller också då material digitaliseras. I Finland upphävs copyrighten om författaren varit död i 70 år. Detta kallas att materialet blivit kulturallmänning. Detta har lett till att mycket material i princip skulle vara redo att publiceras, men processen stoppas på grund av rädsla för lagen eller möjliga anhöriga till författaren. Ibland är författaren nämligen okänd eller så har han/hon skrivit under pseudonym.
Som forskare gäller också att vara på sin vakt då digitaliserad text används. Det finns ju nämligen den möjligheten att materialet förvanskats på något sätt. Text är lätt att redigera på dator. Med diverse textigenkänningsprogram som OCR är det möjligt att snabbt och enkelt komma åt text som skannats. Fördelen med detta är ju tillika att fel kan korrigeras i efterhand. Frågan är om du hellre låter en felaktigt text vara så att de fortfarande kan kallas original eller om du rättar vissa ord för att underlätta sökbarheten?
Många gamla dokument har dessutom unika tecken och marginaler, vilket inte alltid kan återges i digital form. Om fonten ändras och klotter och dylikt tas bort, försvinner också en del av textens unika natur.
Nationalbiblioteket har en hel del digitala samlingar utlagda på nätet. Möjligheten att söka upp gamla tidningar digitalt är enligt min åsikt intressant, och skulle gärna få fortsätta med yngre upplagor. I dagsläget går det bara att komma åt tidningar från 1912 och tidigare. Upphovsrättslagen är en bromskloss på många områden, och i synnerhet då det gäller dagstidningar som inte på något sätt är privata eller besitter hemlig information. Enligt finsk lag är det möjligt att publicera material som är 100 åt gammalt och äldre. Andra länder är mer eller mindre stränga. Släktforskning och övrig informationssökning underlättas av digitalisering, och att Nationalbiblioteket åtminstone publicerat ett flertal dagstidningar är ett steg i rätt riktning.
Även medeltida texter har digitaliserats av Nationalbiblioteket. Fragmenta membranea är en utställning som innehåller tusentals skrifter från det medeltida Sverige, och i synnerhet den östra rikshalvans skrifter.
Riksarkivetsdigitala samling växer med flera miljoner texter årligen. Materialet är till exempel taget från mikrofilm. Genom söktjänsten på Riksarkivets hemsida kan man hitta många slags dokument. Jag slog på skoj in min kära hemkommun Sibbo och hittade allt från kartor från 1800-talet till en bild av Sibbos skyddskårsemblem från inbördeskriget. Ja, du gissade rätt; emblemet föreställde en varg.
Även kyrkböcker har digitaliserats. Denna vecka mestadels från Nykarlebytrakten. Riksarkivet meddelar nämligen vad som senast har digitaliserats. De gör ett bra jobb och uppskattas säkert stort av forskare.
Projektet Zacharias Topelius Skrifter har strävat efter att publicera stoff av den kände sagofarbrorn, professorn och forskaren. Texterna är renskrivna och kommenterade och har säkerligen nått stor popularitet i Norden och övriga Europa. I synnerhet hans dikter är enligt mig fascinerande. Jag återger som avslutning på detta inlägg ett smakprov. Som tur är detta helt tillåtet enligt upphovrätten.
Men jag äger inga blommor, inga perlor äger jag,
Har blott tusen, tusen tankar i mitt hjerta natt och dag;
Alla knoppas de som blommor, och som perlor skimra de,
När jag tyst i mina drömmar ser din bild emot mig le.
Hvad jag har, det ger jag gerna; tag min arma blomstergård!
Tag mitt hjertas bleka drömmar, tag dem, dyra, i din vård!
Du är våren, som hvar blomma väcker upp till lif och dag,
Och det djupa mörka hafvet med dess dolda skatt är jag.
Trevlig fortsatt helg!
Jimmy
Subscribe to:
Post Comments (Atom)
Bra. Hördu Jimmy, nu kan du passa på att kolla lite kod och taggar och putsa din textformattering: Välj att redigera detta inlägg. I textrutans övre kant ser du att du kan välja mellan "Skriv" eller "HTML". Klicka på html, då kan du se alla taggar som finns i texten och som ställer till det - radera dem. Editorn protesterar om det blir "opar" ; kom ihåg att varje tag har en början typ och ett slut med ett snedstreck och samma bokstavskod. Inne i den första taggen kan det finnas en massa attribut och grejs om färger och fonter, bort med allt sånt! Och ja: INNAN DU BÖRJAR: börjar Kopiera hela htm-koden in i notpad, textredigerare så du kan återställa och och börja om, ifall det går helt åt skogen. :)
ReplyDeleteAnvänd b t w förhandsgranskning!
ReplyDeleteHej!
DeleteTack för tipset, jag ska testa på att fiffla med HTML lite :) Min egna wordpress-blogg har aldrig krånglat på detta sätt. Skrev för övrigt texten i ett Worddokument före, men tydligen hjälpte det inte.
Testa Notepad eller textredigerare, så kanske taggarna faller bort ....
ReplyDelete