Text recognition and transcription of handwritten text

On behalf of K-lab and the Munch Museum we are pleased to invite you to a workshop on «Text recognition and transcription of handwritten text» at the National Archives of Norway in Oslo on 13th – 14th November 2017. The workshop will focus on recent developments in the area, such as keyword spotting in digitalised handwritten text, combined with the experiences by those institutions who have tried out the technology. To facilitate an open discussion about this type of technology we have decided to extend the invitation to other Nordic GLAM institutions.

The Workshop will consist of presentations from GLAM-colleagues and the European research project Recognition and Enrichment of Archival Documents (READ, https://read.transkribus.eu/), and several hands-on sessions trying out Transkribus and other tools for working with digitalised handwritten archives.

K-lab is a cooperation between the National Archives of Norway, the Norwegian Mapping Authority, Arts Council Norway and the Norwegian Directorate for Cultural Heritage to experiment with digital presentation and dissemination and improving access to data from cultural institutions.

The Munch Museum is a Memorandum of Understanding partner in the Recognition and Enrichment of Archival Documents project (READ) and has tested out Transkribus on Edvard Munch’s letters. The Museum have digitalised Edvard Munch’s, mostly handwritten, letters and notes and made the material available online at http://emunch.no/

Programme

Day 1. 11.00–18.00

11.00–12.00

1) Short round of introductions. Getting to know the participants and their issues/objectives
2) Handwritten Text Recognition and more. Introduction to the READ project

12.00–13.00

Lunch

13.00–13.45

Transkribus in practice. From the Middle Ages to 20th century, from Arabic to Latin, from Danish to Italian

13.45–14.15

How to reuse existing transcripts as training data for Automated Text Recognition

14.15–14.45

How to create training data from scratch

15.45–16.00

Short break

16.00–17.30

Transkribus workshop (coffee, tea and fruit available – short break if needed).
– How to set up a project in the Transkribus client
– How to use the web-based editor
– How to use Transkribus to set up crowd-sourcing projects
– How to use the API of the Transkribus platform
The workshop will include hands-on work in Transkribus using test sets already installed. Participants who would like to test on their own material should bring this along and will get help to get started.

17.30–18.00

Short, invited responses that discuss their practice today and the potential benefit of including (or switching to) Transkribus in their existing workflow

Day 2. 09.00–14.00

09.00–09.30

Demo. How to query documents with Keyword Spotting (instead of full-text search)

09.30–10.00

Hands-on session. How Transkribus supports the use of mobile phones as document scanners in archives. Please bring along – if you have – paper facsimiles of material you would like to test on.

10.30–11.00

Demo. TranskribusLearn. How volunteers and students can teach themselves to read old scripts

11.00–11.30

Short, invited response that discusses their practice today and the potential benefit of including (or switching to) TXT2IMG tool in their existing workflow

11.30–12.30

Sustaining Transkribus. Discussion and closing remarks

12.30–13.30

Lunch

13.30–14.00

Meet the READ team. Time for workshop participants to discuss ideas for cooperation, participation, tools etc. with the representatives from READ; or to discuss and have another look at presented tools while talking to the experts from READ.

Registration

There is no attendance fee, but registration is mandatory and the registration deadline is November 1st. Participants should register via email to hilde.boe@munchmuseet.no

When you register, please include the following information:

 • Your name
 • Your title/occupation
 • Your institution
 • The email address you wish to use for your Transkribus account as accounts for training will be set up ahead of the workshop. If you already have a Transkribus account please state the email address it is registered on
 • Any special dietary concerns
 • And finally, to facilitate conversation and inspire future cooperation among participants we are including a little more info on the name tags than you usually see. Please include – in no more than 140 characters and preferably in keyword form – a brief description:
  • If you are a regular participant; what do you wish to gain from your participation? Why are you here? What tool/s / functionality/ies are you most interested in?
  • If you represent READ; what is your expertise in this setting? What can you offer to the participating institutions?

#hack4no – planlegging for datatilbydere – 19. september, Riksantikvaren

Samlingen er tenkt å være et idé- og diskusjonsforum for institusjoner og interessenter innfor #hack4no. Først stiller Difi og presenterer seg og sine planer for data.norge.no. Deretter finnes det mulighet at presentere og diskutere både nye APIer og datasett, og at «kna» og «spisse» ideer eller samarbeidskonstellasjoner inn mot #hack4no. Avslutningsvis har vi satt av en økt til konkret jobbing med ideer, tilrettelegging av datasett, samarbeid og/eller annet.

Tid og sted:
19. september fra 10:00-14:00 i Konferansesalen hos Riksantikvaren, Dronningens gate 13, Oslo

Program

10:00-10:15 Velkommen og kort runde rundt bordet 

10:15-11:00 Dokumentasjon av datasett og APIer – Øystein Åsnes, Difi / data.norge.no

 • norge.no‘s rolle – smlmed institusjonenes egen dokumentasjon
 • Difivs den enkelte institusjon – roller og oppgaver
 • norge.no– som en felles katalog, men ikke alltid tilstrekkelig dokumentasjon
 • bruken av norge.no– brukertall, erfaringer, tilbakemeldinger
 • Difi- standarder eller anbefalinger for dokumentasjon av datasett og APIer
 • internasjonale standarder – hva finnes på dette området

11:00-11:30 Nye datasett og «åpnere» data inn mot #hack4no  – hva har institusjonene planlagt?

11:30-12:00 Ideer til #hack4no – presentasjon, drodling og diskusjon i grupper + korte felles fremlegg fra gruppene)

12:00-12:30 Lunsj, kaffe og samtaler  

12:30-14:00 Praktisk arbeid, tilrettelegging og one-to-one møter

Påmelding per epost til cao@ra.no innen mandag 18. september klokken 12:00.

Pre-hack samling – 10. oktober, Teknologihuset

Teknologihuset
Foto: Thomas Marynowski

Pre-hack, dvs. oppkjøring til #hack4no 2017:

 • hack-erfaringer fra vinnere og datatilbydere
 • info om #hack4no

Pre-hack samlingen arrangeres av K-lab samarbeidet og Kartverket / hack4no. Påmelding til pre-hacket finner du her.    (Og her for påmelding til selve #hack4no.)

Program

13:00-13:10 Velkommen og kort om dagens program (ved K-lab og Kartverket)

13:10-13:50 Erfarenheter og «kloke» ord fra fjorårets #hack4no-vinner Hidden.no (ved Pål T. Rørby HIDDEN)

13:50-14:00 Å være datatilbyder på #hack4no» – noen korte refleksjoner fra K-lab samarbeidet (ved Riksantikvaren, Kulturrådet og Arkivverket)

14:00-14:30 Lynpresentasjoner fra datatilbydene (2 min. hver – en god anledning at gjennomføre en generalprøve innfor tilsvarende opplegg på #hack4no 2017)

14:30-14:50 Kaffepause med vrimling og noe attåt

14:50-15:45 Slik får du mest mulig ut av deltakelse på #hack4no. Tips og innspill først og fremst til etatene som skal delta med data. Praktisk informasjon og peptalk før det braker løs (ved prosjektledere #hack4no Sveinung Engeland, Statens Kartverket)

15:45-16:00 Mer kaffe og vrimling samt vel hjem

KulturNav-workshop fredag 29. sept.

KulturNavVelkommen til workshop og gjennomgang av KulturNav – en  ”en gemensam webbasert terminologi- och auktoritetsplattform för nordiska museer och andra kulturarvsinstitutioner. Publicerade metadata är länkade öppna data, vilka kan länkas vidare till andra databaser med öppna data”.

Workshopen arrangeres i felleskap mellom K-lab samarbeidet og Vestfoldmuseene ved prosjektet Sjøfart, data og samlinger, og har som hensikt at gi en introduksjon og oversikt over funksjonalitet og bruksmuligheter i KulturNav med maritim kulturarv som «case» og eksempel gjennom dagen.

Dagen er åpen for både folk som allerede jobber med KulturNav, og for de som ‘bare’ er nysgjerrige. Vi håper på mange deltakere med mange spørsmål, samtaler, erfaringsutveksling og diskusjoner.

Se Ulf Bodins presentasjoner fra workshopen her.

Program:
10:00 – 11:30. Presentation av KulturNav: information, gränssnitt och arbetssätt.
11:30 – 12:30. Lunsj i Kulturrådet sin kantine
12:30 – 16:00. Tre fallstudier med fokus på maritim kulturarv: fartøyet, organisasjonen (t ex ett verft eller rederi) og personen (t ex en fartøyskonstruktør). Praktisk gjennomganger med mulighet at prøve på egen hand i et testmiljø.

Pause efter hvert moment for spørsmål og diskusjon.

Workshopen ledes av Ulf Bodin som är produktansvarig för KulturNav och arbetar på KulturIT. Workshopen hålls på svenska. Arrangementet er gratis og det blir servert lunsj. For at arbeide på egen hand tar du med en egen dator som må kunne kobles opp mot trådløst nettverk.

Registrera dig gärna i KulturNav (http://kulturnav.org) innan, om du inte redan är en brukere. Information om testmiljøet som brukes sendes ut før workshopen. Exempeldata att se på inför workshopen finns här: http://kulturnav.org/project/maritimt-kulturarv

Påmelding på epost innen 25. september til: lars.rogstad@kulturradet.no 

Europeana/1914-18/ – transkribering workshop – mandag 19. juni, Kulturrådet

K-lab og Wikimedia Norge inviterer wikipedianere og ansatte i ABM-sektoren til en dugnad som del av Europeana Challenge 1914-1918.

 • Sted: Kulturrådet, Mølleparken 2, 0459 Oslo
 • Dato og tidspunkt: 19. juni 2017 kl 14–16
 • Påmelding; til astrid@wikimedia.no

Innledningsvis vil Ad Pollé fra Europeana fortelle oss om Europeana sitt arbeid og Europeana Challenge 1914-1918, og det blir en kort innføring og forklaring om bildelisenser og verktøy for overføring av bilder fra DigitaltMuseum til Wikimedia Commons ved Dan Michael Heggø (Danmichaelo) og Lars J. Alvik. (Arkivverket).

På dugnaden kan du hjelpe til med disse spennende oppgavene:

Det blir en matbit, kaffe og drikke på dugnaden! Etter dugnaden er ferdig er alle som har lyst velkommen til å bli med å ta et glass (dekkes selv) på Grünerløkka.

Alle er velkommen! Ta gjerne med egen maskin.

Les mer på https://meta.wikimedia.org/wiki/Europeana/1914-18/Wikimedia_Norge/Workshop

Fremhevet

Workshoper i 2017

workshopK-lab-samarbeidet planlegger flere workshoper i løpet av 2017:

 1. Cidoc CRM – fredag 5. mai, Riksantikvaren
 2. Europeana/1914-18/Wikimedia Norge – transkribering – mandag 19. juni, Kulturrådet
 3. #hack4no – planlegging for datatilbydere – 19. september, Riksantikvaren
 4. KulturNav – 29. september, Kulturrådet. Arrangeres i samarbeid med Vestfoldmuseene ved prosjektet «Sjøfart, data og samlinger».
 5. Pre-#hack4no – 10. oktober, Teknologihuset
 6. Transkribus – transkribering av tekst – 13. og 14. november, Riksarkivet
 7. CIDOC CRM – praktisk mapping – 22. november (tentativt)
   – denne workshopen er utsatt til 2018 (dato ikke berammet)

Workshopene er åpne for alle som ønsker å delta. Nærmere informasjon om program og påmelding blir bl.a. annonsert på K-labs nettsider, og ved epost til aktuelle deltakere.

Og meld gjerne fra dersom du ønsker å bli holdt orientert.

CIDOC CRM workshop – 5. mai 2017

logotrialversionWorkshopen er planlagt og gjennomført av Christian-Emil Ore, Universitetet i Oslo

Workshopen er praktisk orientert om (data)modellering; med følgende innhold: ontologisk analyse,  begrepsdannelse, hendelsesorientert modellering , eksempler fra museum, arkiv og bibliotek, skjemamatching og mapping av data til RDF.

Les mer på CIDOC-CRMs offisielle nettsider.

Del 1

 • Introduksjon til ontologisk analyse og hendelsesorientert datamodellering
 • Integrasjon av informasjon om kulturarv
 • Basisbegreper for å lage en dokumentasjonsstandard
 • CIDOC-CRM
 • Eksempler

Del 2

 • Familien av CIDOC-CRM kompatible ontologier
 • Hvordan modellere metadata for åndsverk, kunst og utøvende kunst

Del 3 Mapping – transformasjon av datasett

– denne delen ble ikke gjennomført på workshopen

 • X3ML – en formalisme for å beskrive datatransformasjon
 • verktøyet 3M basert på X3ML, utviklet ved FORTH å transformere datasett til CIDOC-CRM og andre ontologier. Kort gjennomgang og praktisk demonstrasjon

Presentasjoner

Deltakerliste

Om CIDOC-CRM og workshopen

K-lab lederseminar – Sundvolden, september 2016

Møte, fest i Ørebro med mannlig taler. Utendørs servering DigitaltMuseum
Foto: Worm-Petersen, Severin / Norsk Teknisk Museum, Digitalt Museum CC BY

K-lab arrangerte seminar for de deltakende etatene på Sundvolden, torsdag
8. og fredag 9. september 2016.

Seminaret samlet ledere og fagpersoner, og omfattet blant annet drøftinger av veien videre i 2017 for K-lab-samarbeidet.

Program – med lenker til presentasjoner

Velkommen og introduksjon

 • Kristin Bakken, leder av styringsgruppen for K-lab /  dir. Avd. for kunnskapsutvikling, Riksantikvaren

Overordnete innlegg – hva skjer hos oss?

 • Arkivverket; Ole Gausdal, avdelingsdir. Depotavdelingen
 • Kartverket; Tomas Martin Holtan, avdelingdir. Formidlingstjenesten
 • Kulturrådet; Espen Hernes, fung. avdelingsdir. Kulturavdelingen (ingen ferdig pres.)
 • Riksantikvaren; Bjørn Holstad, seksjonsleder IKT

Hva skjer i de ulike etatene

Arkivverket

Kartverket

Kulturrådet og museene

Riksantikvaren

Åpen og samordnet tilgang til kulturarven – status og muligheter?Robert Engels, seniorrådgiver ACANDO Norge

K-lab fellesaktiviteter/tjenester

Deltakerliste

Oppfølgingsaktiviteter

På seminaret ble det foreslått en rekke små og større oppfølgingsaktiviteter. Dette er oppsummert i vedlagte notat.

De viktigste av aktivitetene er viderført i K-lab arbeidsplan for 2017.

Pokémon Go – what’s in it for us?

Pokémon Go – what’s in it for us?
IMG_4062 (1)
«Statsministeren»; Klassekampen, 4. august 2016

Pokémon Go er sommerens store farsott, og mange lurer på om dette er noe for kulturinstitusjonene, dvs. om vi kan utnytte den store populariteten blant brukerne til å få enda flere interessert i kunst og kultur. For Vigelandsparken i Oslo oversvømmes av ivrige pokemonspillere til omtrent alle døgnets tider, men er de også interessert i skulpturene til Vigeland?

Agnes Moxnes skriver i NRK Ytring (tirsdag 19. juli):

Museer, teatre, spel, botaniske hager, festivaler og orkestre må være digitalt på plass når nye spill og nye løsninger etterspør møtesteder som er ekstraordinære. Derfor bør kulturdirektørene være forberedt på hva det betyr å si «Go eller no go» til å være stoppesteder for det som kommer i kjølvannet av Pokémon Go.

Hvordan kan vi forholde oss til Pokémon Go, dvs. hvordan kan «kulturdirektørene være forberedt til å være stoppesteder for Pokémon Go», jf. hva Agnes Moxnes skriver.

Pokestops og Gyms – stoppestedene i Pokémon Go

De aller fleste (dvs. alle?) pokestoppene og gymmene kommer fra spillet Ingress, der brukerne hadde muligheter til å opprette slike steder (kjent som portaler i Ingress). Disse mulighetene nå er lukket, og det er dessverre ikke mulig å opprette nye steder i Pokémon Go.

Et pokestop består i sin enkleste form av et bilde og ev. en supplerende tekst:

IMG_4051     IMG_4052     IMG_4041

Det er altså denne (svært) begrensede informasjonen som formidler kunst- eller kulturhistorisk informasjon til spillerne. Ideelt sett burde tekstene vært mer informative – slik som eksempelet med Mossekonvensjonen over, ev. også med lenker til f.eks. DigitaltMuseum, Kulturminnesøk eller Wikipedia.

ingress
Portaler i Ingress

Det er dessverre ikke mulig å endre eller supplere den eksisterende informasjonen i Pokémon Go. Men i Ingress – der disse objektene altså kommer fra – var det mulig å redigere informasjonen. Dvs. det var mulig å sende forslag om endringer til en redaksjon (spillutvikleren Niantic), men i praksis er det visst 6-12 mnd ventetid på slike henvendelser.

The White Rabbit - pokestop
Ingressportalen på kaninstatuen er blitt til en pokestop

Les også Tord Nilsens klargjørende innlegg «Til de som klager på Pokestops … « på nettstedet kanDusi.no og «De aller fleste aner ikke hvor «pokéstoppene» kommer fra» i Bergensavisen.

 

Vi kan altså ikke lenger fallby våre egne institusjoner eller attraksjoner, men vi kan gjøre dem som allerede finnes mest mulig attraktive for spillerne.

Men det store spørsmålet er jo om spillerne egentlig er noe særlig interessert i skulpturene i Vigelandparken, skulpturen «Knuten» i Moss eller den gamle steinportalen inn til Aalby gård på Jeløya, selv om de jakter på pokemoner i området.

Hvordan trekke publikum til «mine» steder?

Vigelands Hus
NRK Sørlandet, 25. juli 2016

Museene og andre kulturinstitusjoner kan for eksempel gjøre som Vigelands Hus i Mandal. De har lagt ut «lures» ved pokestop i nærheten, og tilbyr tørste og sultne pokemon-spillere enkel servering. Og så håper de at alle pokemonspillerne som dermed kommer til museet for å jakte pokemoner også vil fatte litt interesse for det museet egentlig tilbyr sine besøkende.

«Lures» tiltrekker seg pokemoner til en pokestop i en begrenset periode, og gjør dermed dette stedet mer attraktivt for spillerne. Lures kan kjøpes (for rede penger), og er altså noe kulturinstitusjonene kan investere i for å bedre attraktiviteten hos spillerne.

Ønskeliste for nye versjoner av Pokémon Go

Det er muligens svært naivt, men ønsker koster lite – og hvis noen med gode forbindelser til spillutvikleren Niantic kan videreformidle – så kan dette være noen aktuelle utviklingspunkter:

 • opprette nye stoppesteder – pokestopper og gymmer
 • supplere informasjonen om eksisterende stoppesteder

Gjøreliste for kulturdirektører

Kulturinstitusjoner som ønsker mer trafikk til «sine» pokestopper kan gjøre som Vigelands Hus i Mandal for å gjøre seg attraktive blant pokemonspillerne:

 • legge ut «lures»
 • tilby lademuligheter for desperate pokemonspillere med tomme batterier
 • enkel servering – cola, vafler og is

 

Og så får vi heller ikke bli så veldig skuffet når vi ev. innser (?) at de fleste pokemon-jegerne som svermer rundt våre lokaliteter kanskje ikke er så veldig interessert i kunst og kultur, selv om de altså befinner seg i Vigelandsparken eller på F15 på Jeløya eller blant skulpturene i gågata i Moss.