Text recognition and transcription of handwritten text

On behalf of K-lab and the Munch Museum we are pleased to invite you to a workshop on «Text recognition and transcription of handwritten text» at the National Archives of Norway in Oslo on 13th – 14th November 2017. The workshop will focus on recent developments in the area, such as keyword spotting in digitalised handwritten text, combined with the experiences by those institutions who have tried out the technology. To facilitate an open discussion about this type of technology we have decided to extend the invitation to other Nordic GLAM institutions.

The Workshop will consist of presentations from GLAM-colleagues and the European research project Recognition and Enrichment of Archival Documents (READ, https://read.transkribus.eu/), and several hands-on sessions trying out Transkribus and other tools for working with digitalised handwritten archives.

K-lab is a cooperation between the National Archives of Norway, the Norwegian Mapping Authority, Arts Council Norway and the Norwegian Directorate for Cultural Heritage to experiment with digital presentation and dissemination and improving access to data from cultural institutions.

The Munch Museum is a Memorandum of Understanding partner in the Recognition and Enrichment of Archival Documents project (READ) and has tested out Transkribus on Edvard Munch’s letters. The Museum have digitalised Edvard Munch’s, mostly handwritten, letters and notes and made the material available online at http://emunch.no/

Programme

Day 1. 11.00–18.00

11.00–12.00

1) Short round of introductions. Getting to know the participants and their issues/objectives
2) Handwritten Text Recognition and more. Introduction to the READ project

12.00–13.00

Lunch

13.00–13.45

Transkribus in practice. From the Middle Ages to 20th century, from Arabic to Latin, from Danish to Italian

13.45–14.15

How to reuse existing transcripts as training data for Automated Text Recognition

14.15–14.45

How to create training data from scratch

15.45–16.00

Short break

16.00–17.30

Transkribus workshop (coffee, tea and fruit available – short break if needed).
– How to set up a project in the Transkribus client
– How to use the web-based editor
– How to use Transkribus to set up crowd-sourcing projects
– How to use the API of the Transkribus platform
The workshop will include hands-on work in Transkribus using test sets already installed. Participants who would like to test on their own material should bring this along and will get help to get started.

17.30–18.00

Short, invited responses that discuss their practice today and the potential benefit of including (or switching to) Transkribus in their existing workflow

Day 2. 09.00–14.00

09.00–09.30

Demo. How to query documents with Keyword Spotting (instead of full-text search)

09.30–10.00

Hands-on session. How Transkribus supports the use of mobile phones as document scanners in archives. Please bring along – if you have – paper facsimiles of material you would like to test on.

10.30–11.00

Demo. TranskribusLearn. How volunteers and students can teach themselves to read old scripts

11.00–11.30

Short, invited response that discusses their practice today and the potential benefit of including (or switching to) TXT2IMG tool in their existing workflow

11.30–12.30

Sustaining Transkribus. Discussion and closing remarks

12.30–13.30

Lunch

13.30–14.00

Meet the READ team. Time for workshop participants to discuss ideas for cooperation, participation, tools etc. with the representatives from READ; or to discuss and have another look at presented tools while talking to the experts from READ.

Registration

There is no attendance fee, but registration is mandatory and the registration deadline is November 1st. Participants should register via email to hilde.boe@munchmuseet.no

When you register, please include the following information:

 • Your name
 • Your title/occupation
 • Your institution
 • The email address you wish to use for your Transkribus account as accounts for training will be set up ahead of the workshop. If you already have a Transkribus account please state the email address it is registered on
 • Any special dietary concerns
 • And finally, to facilitate conversation and inspire future cooperation among participants we are including a little more info on the name tags than you usually see. Please include – in no more than 140 characters and preferably in keyword form – a brief description:
  • If you are a regular participant; what do you wish to gain from your participation? Why are you here? What tool/s / functionality/ies are you most interested in?
  • If you represent READ; what is your expertise in this setting? What can you offer to the participating institutions?

#hack4no – planlegging for datatilbydere – 19. september, Riksantikvaren

Samlingen er tenkt å være et idé- og diskusjonsforum for institusjoner og interessenter innfor #hack4no. Først stiller Difi og presenterer seg og sine planer for data.norge.no. Deretter finnes det mulighet at presentere og diskutere både nye APIer og datasett, og at «kna» og «spisse» ideer eller samarbeidskonstellasjoner inn mot #hack4no. Avslutningsvis har vi satt av en økt til konkret jobbing med ideer, tilrettelegging av datasett, samarbeid og/eller annet.

Tid og sted:
19. september fra 10:00-14:00 i Konferansesalen hos Riksantikvaren, Dronningens gate 13, Oslo

Program

10:00-10:15 Velkommen og kort runde rundt bordet 

10:15-11:00 Dokumentasjon av datasett og APIer – Øystein Åsnes, Difi / data.norge.no

 • norge.no‘s rolle – smlmed institusjonenes egen dokumentasjon
 • Difivs den enkelte institusjon – roller og oppgaver
 • norge.no– som en felles katalog, men ikke alltid tilstrekkelig dokumentasjon
 • bruken av norge.no– brukertall, erfaringer, tilbakemeldinger
 • Difi- standarder eller anbefalinger for dokumentasjon av datasett og APIer
 • internasjonale standarder – hva finnes på dette området

11:00-11:30 Nye datasett og «åpnere» data inn mot #hack4no  – hva har institusjonene planlagt?

11:30-12:00 Ideer til #hack4no – presentasjon, drodling og diskusjon i grupper + korte felles fremlegg fra gruppene)

12:00-12:30 Lunsj, kaffe og samtaler  

12:30-14:00 Praktisk arbeid, tilrettelegging og one-to-one møter

Påmelding per epost til cao@ra.no innen mandag 18. september klokken 12:00.

Pre-hack samling – 10. oktober, Teknologihuset

Teknologihuset
Foto: Thomas Marynowski

Pre-hack, dvs. oppkjøring til #hack4no 2017:

 • hack-erfaringer fra vinnere og datatilbydere
 • info om #hack4no

Pre-hack samlingen arrangeres av K-lab samarbeidet og Kartverket / hack4no. Påmelding til pre-hacket finner du her.    (Og her for påmelding til selve #hack4no.)

Program

13:00-13:10 Velkommen og kort om dagens program (ved K-lab og Kartverket)

13:10-13:50 Erfarenheter og «kloke» ord fra fjorårets #hack4no-vinner Hidden.no (ved Pål T. Rørby HIDDEN)

13:50-14:00 Å være datatilbyder på #hack4no» – noen korte refleksjoner fra K-lab samarbeidet (ved Riksantikvaren, Kulturrådet og Arkivverket)

14:00-14:30 Lynpresentasjoner fra datatilbydene (2 min. hver – en god anledning at gjennomføre en generalprøve innfor tilsvarende opplegg på #hack4no 2017)

14:30-14:50 Kaffepause med vrimling og noe attåt

14:50-15:45 Slik får du mest mulig ut av deltakelse på #hack4no. Tips og innspill først og fremst til etatene som skal delta med data. Praktisk informasjon og peptalk før det braker løs (ved prosjektledere #hack4no Sveinung Engeland, Statens Kartverket)

15:45-16:00 Mer kaffe og vrimling samt vel hjem

KulturNav-workshop fredag 29. sept.

KulturNavVelkommen til workshop og gjennomgang av KulturNav – en  ”en gemensam webbasert terminologi- och auktoritetsplattform för nordiska museer och andra kulturarvsinstitutioner. Publicerade metadata är länkade öppna data, vilka kan länkas vidare till andra databaser med öppna data”.

Workshopen arrangeres i felleskap mellom K-lab samarbeidet og Vestfoldmuseene ved prosjektet Sjøfart, data og samlinger, og har som hensikt at gi en introduksjon og oversikt over funksjonalitet og bruksmuligheter i KulturNav med maritim kulturarv som «case» og eksempel gjennom dagen.

Dagen er åpen for både folk som allerede jobber med KulturNav, og for de som ‘bare’ er nysgjerrige. Vi håper på mange deltakere med mange spørsmål, samtaler, erfaringsutveksling og diskusjoner.

Se Ulf Bodins presentasjoner fra workshopen her.

Program:
10:00 – 11:30. Presentation av KulturNav: information, gränssnitt och arbetssätt.
11:30 – 12:30. Lunsj i Kulturrådet sin kantine
12:30 – 16:00. Tre fallstudier med fokus på maritim kulturarv: fartøyet, organisasjonen (t ex ett verft eller rederi) og personen (t ex en fartøyskonstruktør). Praktisk gjennomganger med mulighet at prøve på egen hand i et testmiljø.

Pause efter hvert moment for spørsmål og diskusjon.

Workshopen ledes av Ulf Bodin som är produktansvarig för KulturNav och arbetar på KulturIT. Workshopen hålls på svenska. Arrangementet er gratis og det blir servert lunsj. For at arbeide på egen hand tar du med en egen dator som må kunne kobles opp mot trådløst nettverk.

Registrera dig gärna i KulturNav (http://kulturnav.org) innan, om du inte redan är en brukere. Information om testmiljøet som brukes sendes ut før workshopen. Exempeldata att se på inför workshopen finns här: http://kulturnav.org/project/maritimt-kulturarv

Påmelding på epost innen 25. september til: lars.rogstad@kulturradet.no