Text recognition and transcription of handwritten text

On behalf of K-lab and the Munch Museum we are pleased to invite you to a workshop on «Text recognition and transcription of handwritten text» at the National Archives of Norway in Oslo on 13th – 14th November 2017. The workshop will focus on recent developments in the area, such as keyword spotting in digitalised handwritten text, combined with the experiences by those institutions who have tried out the technology. To facilitate an open discussion about this type of technology we have decided to extend the invitation to other Nordic GLAM institutions.

The Workshop will consist of presentations from GLAM-colleagues and the European research project Recognition and Enrichment of Archival Documents (READ, https://read.transkribus.eu/), and several hands-on sessions trying out Transkribus and other tools for working with digitalised handwritten archives.

K-lab is a cooperation between the National Archives of Norway, the Norwegian Mapping Authority, Arts Council Norway and the Norwegian Directorate for Cultural Heritage to experiment with digital presentation and dissemination and improving access to data from cultural institutions.

The Munch Museum is a Memorandum of Understanding partner in the Recognition and Enrichment of Archival Documents project (READ) and has tested out Transkribus on Edvard Munch’s letters. The Museum have digitalised Edvard Munch’s, mostly handwritten, letters and notes and made the material available online at http://emunch.no/

Programme

Day 1. 11.00–18.00

11.00–12.00

1) Short round of introductions. Getting to know the participants and their issues/objectives
2) Handwritten Text Recognition and more. Introduction to the READ project

12.00–13.00

Lunch

13.00–13.45

Transkribus in practice. From the Middle Ages to 20th century, from Arabic to Latin, from Danish to Italian

13.45–14.15

How to reuse existing transcripts as training data for Automated Text Recognition

14.15–14.45

How to create training data from scratch

15.45–16.00

Short break

16.00–17.30

Transkribus workshop (coffee, tea and fruit available – short break if needed).
– How to set up a project in the Transkribus client
– How to use the web-based editor
– How to use Transkribus to set up crowd-sourcing projects
– How to use the API of the Transkribus platform
The workshop will include hands-on work in Transkribus using test sets already installed. Participants who would like to test on their own material should bring this along and will get help to get started.

17.30–18.00

Short, invited responses that discuss their practice today and the potential benefit of including (or switching to) Transkribus in their existing workflow

Day 2. 09.00–14.00

09.00–09.30

Demo. How to query documents with Keyword Spotting (instead of full-text search)

09.30–10.00

Hands-on session. How Transkribus supports the use of mobile phones as document scanners in archives. Please bring along – if you have – paper facsimiles of material you would like to test on.

10.30–11.00

Demo. TranskribusLearn. How volunteers and students can teach themselves to read old scripts

11.00–11.30

Short, invited response that discusses their practice today and the potential benefit of including (or switching to) TXT2IMG tool in their existing workflow

11.30–12.30

Sustaining Transkribus. Discussion and closing remarks

12.30–13.30

Lunch

13.30–14.00

Meet the READ team. Time for workshop participants to discuss ideas for cooperation, participation, tools etc. with the representatives from READ; or to discuss and have another look at presented tools while talking to the experts from READ.

Registration

There is no attendance fee, but registration is mandatory and the registration deadline is November 1st. Participants should register via email to hilde.boe@munchmuseet.no

When you register, please include the following information:

  • Your name
  • Your title/occupation
  • Your institution
  • The email address you wish to use for your Transkribus account as accounts for training will be set up ahead of the workshop. If you already have a Transkribus account please state the email address it is registered on
  • Any special dietary concerns
  • And finally, to facilitate conversation and inspire future cooperation among participants we are including a little more info on the name tags than you usually see. Please include – in no more than 140 characters and preferably in keyword form – a brief description:
    • If you are a regular participant; what do you wish to gain from your participation? Why are you here? What tool/s / functionality/ies are you most interested in?
    • If you represent READ; what is your expertise in this setting? What can you offer to the participating institutions?

#hack4no – planlegging for datatilbydere – 19. september, Riksantikvaren

Samlingen er tenkt å være et idé- og diskusjonsforum for institusjoner og interessenter innfor #hack4no. Først stiller Difi og presenterer seg og sine planer for data.norge.no. Deretter finnes det mulighet at presentere og diskutere både nye APIer og datasett, og at «kna» og «spisse» ideer eller samarbeidskonstellasjoner inn mot #hack4no. Avslutningsvis har vi satt av en økt til konkret jobbing med ideer, tilrettelegging av datasett, samarbeid og/eller annet.

Tid og sted:
19. september fra 10:00-14:00 i Konferansesalen hos Riksantikvaren, Dronningens gate 13, Oslo

Program

10:00-10:15 Velkommen og kort runde rundt bordet 

10:15-11:00 Dokumentasjon av datasett og APIer – Øystein Åsnes, Difi / data.norge.no

  • norge.no‘s rolle – smlmed institusjonenes egen dokumentasjon
  • Difivs den enkelte institusjon – roller og oppgaver
  • norge.no– som en felles katalog, men ikke alltid tilstrekkelig dokumentasjon
  • bruken av norge.no– brukertall, erfaringer, tilbakemeldinger
  • Difi- standarder eller anbefalinger for dokumentasjon av datasett og APIer
  • internasjonale standarder – hva finnes på dette området

11:00-11:30 Nye datasett og «åpnere» data inn mot #hack4no  – hva har institusjonene planlagt?

11:30-12:00 Ideer til #hack4no – presentasjon, drodling og diskusjon i grupper + korte felles fremlegg fra gruppene)

12:00-12:30 Lunsj, kaffe og samtaler  

12:30-14:00 Praktisk arbeid, tilrettelegging og one-to-one møter

Påmelding per epost til cao@ra.no innen mandag 18. september klokken 12:00.

Pre-hack samling – 10. oktober, Teknologihuset

Teknologihuset
Foto: Thomas Marynowski

Pre-hack, dvs. oppkjøring til #hack4no 2017:

  • hack-erfaringer fra vinnere og datatilbydere
  • info om #hack4no

Pre-hack samlingen arrangeres av K-lab samarbeidet og Kartverket / hack4no. Påmelding til pre-hacket finner du her.    (Og her for påmelding til selve #hack4no.)

Program

13:00-13:10 Velkommen og kort om dagens program (ved K-lab og Kartverket)

13:10-13:50 Erfarenheter og «kloke» ord fra fjorårets #hack4no-vinner Hidden.no (ved Pål T. Rørby HIDDEN)

13:50-14:00 Å være datatilbyder på #hack4no» – noen korte refleksjoner fra K-lab samarbeidet (ved Riksantikvaren, Kulturrådet og Arkivverket)

14:00-14:30 Lynpresentasjoner fra datatilbydene (2 min. hver – en god anledning at gjennomføre en generalprøve innfor tilsvarende opplegg på #hack4no 2017)

14:30-14:50 Kaffepause med vrimling og noe attåt

14:50-15:45 Slik får du mest mulig ut av deltakelse på #hack4no. Tips og innspill først og fremst til etatene som skal delta med data. Praktisk informasjon og peptalk før det braker løs (ved prosjektledere #hack4no Sveinung Engeland, Statens Kartverket)

15:45-16:00 Mer kaffe og vrimling samt vel hjem

KulturNav-workshop fredag 29. sept.

KulturNavVelkommen til workshop og gjennomgang av KulturNav – en  ”en gemensam webbasert terminologi- och auktoritetsplattform för nordiska museer och andra kulturarvsinstitutioner. Publicerade metadata är länkade öppna data, vilka kan länkas vidare till andra databaser med öppna data”.

Workshopen arrangeres i felleskap mellom K-lab samarbeidet og Vestfoldmuseene ved prosjektet Sjøfart, data og samlinger, og har som hensikt at gi en introduksjon og oversikt over funksjonalitet og bruksmuligheter i KulturNav med maritim kulturarv som «case» og eksempel gjennom dagen.

Dagen er åpen for både folk som allerede jobber med KulturNav, og for de som ‘bare’ er nysgjerrige. Vi håper på mange deltakere med mange spørsmål, samtaler, erfaringsutveksling og diskusjoner.

Se Ulf Bodins presentasjoner fra workshopen her.

Program:
10:00 – 11:30. Presentation av KulturNav: information, gränssnitt och arbetssätt.
11:30 – 12:30. Lunsj i Kulturrådet sin kantine
12:30 – 16:00. Tre fallstudier med fokus på maritim kulturarv: fartøyet, organisasjonen (t ex ett verft eller rederi) og personen (t ex en fartøyskonstruktør). Praktisk gjennomganger med mulighet at prøve på egen hand i et testmiljø.

Pause efter hvert moment for spørsmål og diskusjon.

Workshopen ledes av Ulf Bodin som är produktansvarig för KulturNav och arbetar på KulturIT. Workshopen hålls på svenska. Arrangementet er gratis og det blir servert lunsj. For at arbeide på egen hand tar du med en egen dator som må kunne kobles opp mot trådløst nettverk.

Registrera dig gärna i KulturNav (http://kulturnav.org) innan, om du inte redan är en brukere. Information om testmiljøet som brukes sendes ut før workshopen. Exempeldata att se på inför workshopen finns här: http://kulturnav.org/project/maritimt-kulturarv

Påmelding på epost innen 25. september til: lars.rogstad@kulturradet.no 

Europeana/1914-18/ – transkribering workshop – mandag 19. juni, Kulturrådet

K-lab og Wikimedia Norge inviterer wikipedianere og ansatte i ABM-sektoren til en dugnad som del av Europeana Challenge 1914-1918.

  • Sted: Kulturrådet, Mølleparken 2, 0459 Oslo
  • Dato og tidspunkt: 19. juni 2017 kl 14–16
  • Påmelding; til astrid@wikimedia.no

Innledningsvis vil Ad Pollé fra Europeana fortelle oss om Europeana sitt arbeid og Europeana Challenge 1914-1918, og det blir en kort innføring og forklaring om bildelisenser og verktøy for overføring av bilder fra DigitaltMuseum til Wikimedia Commons ved Dan Michael Heggø (Danmichaelo) og Lars J. Alvik. (Arkivverket).

På dugnaden kan du hjelpe til med disse spennende oppgavene:

Det blir en matbit, kaffe og drikke på dugnaden! Etter dugnaden er ferdig er alle som har lyst velkommen til å bli med å ta et glass (dekkes selv) på Grünerløkka.

Alle er velkommen! Ta gjerne med egen maskin.

Les mer på https://meta.wikimedia.org/wiki/Europeana/1914-18/Wikimedia_Norge/Workshop

Fremhevet

Workshoper i 2017

workshopK-lab-samarbeidet planlegger flere workshoper i løpet av 2017:

  1. Cidoc CRM – fredag 5. mai, Riksantikvaren
  2. Europeana/1914-18/Wikimedia Norge – transkribering – mandag 19. juni, Kulturrådet
  3. #hack4no – planlegging for datatilbydere – 19. september, Riksantikvaren
  4. KulturNav – 29. september, Kulturrådet. Arrangeres i samarbeid med Vestfoldmuseene ved prosjektet «Sjøfart, data og samlinger».
  5. Pre-#hack4no – 10. oktober, Teknologihuset
  6. Transkribus – transkribering av tekst – 13. og 14. november, Riksarkivet
  7. CIDOC CRM – praktisk mapping – 22. november (tentativt)
     – denne workshopen er utsatt til 2018 (dato ikke berammet)

Workshopene er åpne for alle som ønsker å delta. Nærmere informasjon om program og påmelding blir bl.a. annonsert på K-labs nettsider, og ved epost til aktuelle deltakere.

Og meld gjerne fra dersom du ønsker å bli holdt orientert.

CIDOC CRM workshop – 5. mai 2017

logotrialversionWorkshopen er planlagt og gjennomført av Christian-Emil Ore, Universitetet i Oslo

Workshopen er praktisk orientert om (data)modellering; med følgende innhold: ontologisk analyse,  begrepsdannelse, hendelsesorientert modellering , eksempler fra museum, arkiv og bibliotek, skjemamatching og mapping av data til RDF.

Les mer på CIDOC-CRMs offisielle nettsider.

Del 1

  • Introduksjon til ontologisk analyse og hendelsesorientert datamodellering
  • Integrasjon av informasjon om kulturarv
  • Basisbegreper for å lage en dokumentasjonsstandard
  • CIDOC-CRM
  • Eksempler

Del 2

  • Familien av CIDOC-CRM kompatible ontologier
  • Hvordan modellere metadata for åndsverk, kunst og utøvende kunst

Del 3 Mapping – transformasjon av datasett

– denne delen ble ikke gjennomført på workshopen

  • X3ML – en formalisme for å beskrive datatransformasjon
  • verktøyet 3M basert på X3ML, utviklet ved FORTH å transformere datasett til CIDOC-CRM og andre ontologier. Kort gjennomgang og praktisk demonstrasjon

Presentasjoner

Deltakerliste

Om CIDOC-CRM og workshopen

Norske vinnere i #hack4norden

Norske vinnere i #hack4norden

17 500 personer fra 124 land. Teknologi, innovasjon, og litt kultur og reinsdyr . Slush var stedet for finale i #hack4norden med norsk 1. og 2. plass. Gratulerer!

I år var det ikke bare nasjonal hack – #hack4no – men også en nordisk hacktahon – #hack4norden. Finalen gikk av stabelen 1/12 i Helsingfors som et sidearrangement på gigantiske Slush som har fokus på entreprenørskap (17 500 deltakere, deriblant vår egen kronprins og lillesøster Zuckenberg). Åtte lag deltok, fire fra mer åpen «klasse» og fire fra kultur/GLAM.  I selve finalen var de ingen kategoriinndeling.

Hidden.no tok 1. plass med appkonseptet om å få immateriell kulturarv (i form av sagn og myter) frem når man er ute og ferdes i landskapet. Og Savemyreindeer på 2. plass utvikler en løsning for å forhindre at reinsdyr blir kjørt i hjel på jernbanespor.  Disse lagene fulgte opp tradisjonen fra i fjor da #biocaching og H4O vant. Solide konsepter og pitcher førte til seier.

Nordic Innovation var ansvarlig for finalen og oppfølging av finalistene fra Norge, Danmark, Sverige og Finland i forkant. Men både Kartverket og vi kulturetatene har vært i dialog med vinnerlagene etter hack4no.  Kartverket er i tillegg representert i «Savemyreindeer». Vinnerne var selvsagt strålende fornøyd med plasseringene, men også med alt de hadde lært i løpet av oppholdet i Finland.

Kulturdeltakelse er kommet i stand på bakgrunn av samarbeid over lenger tid mellom sentrale kultureateter i de ulike landene, deriblant etatene bak K-lab. Det er første gang kultur / GLAM (Galleries, Libraries, Archives, Museums) er en del av denne nordiske finalen. Det har vi fått til etter god dialog mellom nordiske samarbeidspartnere og som et resultat av samarbeid og kontakt gjennom de siste årene knyttet både til hackathons, men også andre aktiviteter på tvers av landene som bl.a. Nordlod.

Finalistene ble valgt ut fra de nasjonale hackathonene. #hackyourheritage har vært mottoet for kultur / GLAM.  Slots- og Kulturstyrelsen, Digisam og Open Knowledge Finland  / Aalto University har vært de sentrale aktørene i dette samarbeidet sammen med K-lab-etatene. På et møte i regi av Nordic Innovation 1. desember var vi samlet. Det var stor interesse for og enighet om at det er viktig å fortsette et nordisk samarbeid, og ikke bare knyttet til hackathons, men også på andre områder som er viktig for samordning og utvikling innen det digitale området. Valg av samarbeidsform og –områder må følges opp fremover.

Oppfølging av vinnerlagene er også en viktig oppgave, for kultursiden er det en gylden anledning til å få ut viktig kulturarv.

Ellers var det veldig interessant å få et lite innblikk i den store teknologi / businessverdenen hvor sidemannen på lunsjen er fra Korea og skal investere et «mindre beløp», 20 000 Euro. Det setter jo ting litt i perspektiv. Vi har ikke de midlene, men vi har verdifullt innhold.

Omtaler:
Kartverket / hack4no
Nordic Innovation
Computerworld

slush

Verdien av data ligger i bruken

Difi og Kommunal- og moderniseringsdepartementet arrangerte
29. november seminaret «Verdien av data ligger i bruken». Seminaret er et ledd i oppfølgingen av st. meld.«Digital agenda».

Fem departement snakket om prosessen med utforming av handlingsplaner for åpne data innen geodata, kultur, forskning, transport og offentlige utgifter. #Arkivverket, #Kulturrådet og #Kartverket er alle direkte involvert i dette planarbeidet.

Fem gode og varierte innlegg om faktisk bruk av åpne data avsluttet seminaret – disse presentasjonene belyste mange konkrete problemstillinger knyttet til verdien av og utfordringene ved dagens åpne data.

Presentasjonene er nå lagt ut på data.norge.no

Takk!

Vi i K-Lab ønsker å takke alle som bidro til å gjøre vår erfaringskonferanse «Mulighetenes rom» på MESH til en veldig hyggelig og innholdsrik opplevelse. Takk til innlederne som stilte opp og leverte innlegg med faglig tyngde og stort engasjement. Takk til alle dere som møtte opp for å høre på for deres deltagelse og for alle positive tilbakemeldinger. Vi håper dere hadde en like fin dag som oss. En stor takk også til de ansatte ved MESH for glimrende oppfølging på alle områder.

Vi har nå lagt ut lenker til opptak av alle innleggene i konferanseprogrammet her. Her finner dere også lenker til presentasjonene.