måndag 31 oktober 2011

Europeiskt kompetenscentrum kring digitalisering invigt

24-25 oktober höll det stora EU-projektet IMPACT (Improving access to text) sin avslutande konferens i British Library, London, ”Digitisation & OCR: Better, faster, cheaper”.

Under två välfyllda dagar fick vi ta del av ett 20-tal presentationer som sträckte sig från övergripande strategier kring digitalisering från stora aktörer som British Library och Europeiska kommissionen, över konkreta fallstudier kring effekten av ändrade skanningsmetoder, förbättrade historiska lexikon mm för tolkningsresultatet, till presentation av konkreta verktyg tillgängliga för nerladdning. Dag två av konferensen invigdes det utlovade kompetenscentret, Impact Centre of Competence med grundläggande information fritt tillgängligt för alla (och ytterligare resurser för betalande medlemmar). Anmäl dig på hemsidan, länk nedan.
Vi var sammanlagt 150 deltagare från drygt 20-talet länder. Många spännande personliga möten och intressanta presentationer, tipsar om några nedan.

Först några allmänna länkar:
Impact Centre of Competence, se http://www.digitisation.eu/
Impact-projektet har också en omfattande blogg, se http://www.impact-project.eu/home/
Presentationer (powerpoint) från denna – och andra – konferenser finns tillgängliga via slideshare, se http://www.slideshare.net/impactproject

För det praktiska skanningsarbetet var Apostolos Antonacopolos presentation ”Case study: Scanning parameters” väldigt intressant. Vilken betydelse har upplösningen, valet av svart-vit, gråskale eller färgskanning mm, se http://www.slideshare.net/impactproject/impact-conference-2011
Intressant att se nya verktyg utvecklade vid det grekiska centret för bildanalys, NCSR ”Demokritos” för att hantera de defekter som ofta finns i äldre böcker, skeva ”bubbliga” sidor pga fukt eller felaktiga inbindningar, se http://www.slideshare.net/impactproject/impact-final-conference-research-parallel-sessions02-research-sessionncsrtools Det är också möjligt att ladda ner demo-versioner av verktygen.
Spännande var också att se IBMs programvara CONCERT demonstreras. Såg ut som ett verktyg som ger användarna möjlighet att på ett intuitivt sätt enkelt korrigera stora mängder ocr-tolkade data. Prislappen oklar, sannolikt hög - men en intressant produkt, se http://www.slideshare.net/impactproject/impact-final-conference-asaf-tzadok

Många andra intressanta presentationer värda att titta på, välj utifrån konferensprogrammet här: http://www.impact-project.eu/news/ic2011/conference-programme/

Fick också tillfälle att prata med personer insatta i Googles och ProQuests pågående projekt, leverantörer som gärna sålde skanningsrobotar såväl som efterbearbetningstjänster i form av textsegmenteringverktyg eller färdiga produkter i form av ePub-böcker (för en billig penning direkt från Indien) och många fler. Berättar mer över en kopp kaffe ...