Un problema nella digitalizzazione di libri e manoscritti antichi:

la correzione della distorsione indotta dalla curvatura della pagina



Per descrivere il lavoro, allego semplicemente l'introduzione della relazione finale. La relazione completa potete scaricarla tranquillamente dal link che trovate più avanti.



La carta delle pagine di uno scritto antico, nella migliore condizione di conservazione, non è mai perfettamente liscia come la carta che si vede solitamente nei libri moderni, ma a causa del tempo e dell'umidità ha perso la sua originale conformazione liscia e presenta quindi delle zone con convessità o concavità più o meno accentuate.

Questo fatto pone un problema abbastanza grande nel momento in cui si decide di fotografare questi testi antichi per scopi di catalogazione, pubblicazione o per una semplice immagine da poter inserire in un qualunque articolo.

La deformazione della superficie delle pagine causa in primo luogo una notevole distorsione dei caratteri del testo; in secondo luogo presenta anche una disuniformità dell'illuminazione, creando zone di luce illuminate con angolature diverse e quindi effetti poco belli esteticamente ed abbastanza fastidiosi per gli osservatori.

Si è presentata quindi l'esigenza di studiare sistemi per la correzione di queste distorsioni. Per cercare sempre di non sollecitare mai più del dovuto l'oggetto in esame, che potrebbe essere benissimo un antico manoscritto di estremo valore, si deve sempre cercare un sistema non distruttivo, in cui l'analisi e la successiva elaborazione vengano fatte a debita distanza, andando il meno possibile a contatto fisico con l'oggetto. Da qui l'esigenza di digitalizzare l'oggetto.

Questa azione è molto simile al fotografare, ma, invece di un supporto cartaceo, si utilizza un supporto informatico: l'immagine è prelevata come una serie di informazioni numeriche che un computer in qualsiasi momento interpreta e ricostruisce visivamente attraverso un monitor.

Successivamente c'è l'operazione di stiramento, non più delicatissima come nel caso in cui fosse stata svolta direttamente sul reperto, ma eseguita a livello computazionale come elaborazione aritmetica delle informazioni numeriche costituenti le immagini digitali.

Quindi nessun contatto con le pagine degli scritti; risultato: l'uso di un sistema totalmente non distruttivo.”





Ecco qui i file relativi al lavoro svolto.

Per sapere come funziona l’algoritmo e i vari programmi potete prelevare la relazione del lavoro (1,3 MB, in formato PDF e da decomprimere con WinZip o equivalenti).



I listati dei vari programmi in linguaggio c possono essere scaricati qui.



Il programma ech3_completo.c usa in input i file coi dati di profondità della silicon graphics e costruisce dei file ascii. I file costruiti sulle immagini testate possono essere scaricati sotto.



ech4_excel costruisce i dati mettendoli in un file ascii, organizzato a tabella e apribile con excel (e penso con qualsiasi altro foglio elettronico).



ech5_wrl costruisce dei file visualizzabili col Cortona, visualizzatore wrl.

ech6_wrl2 è identico ad ech5, ma da la metà dei dati, per ridurre la dimensione del file che potrebbe essere troppo grande per immagini 512x512.



Il programma sti applica l’algoritmo.



I file senza estensione sono i file SGI (Silicon Graphics Image) contenenti i dati di profondità.

I file .color.sgi sono i file SGI con i dati colore.

I file .ras sono file a tonalità di grigio in formato sunraster. Sono l’input per i vari programmi c.

I file ech, excel, wrl e wrl2 sono i file dei programmi illustrati sopra.



I file _sti.ras sono i file dell’immagine stirata.



Le immagini su cui sono stati testati gli algoritmi sono le seguenti.



cil150_2 è un foglio di carta bianco su un cilindro con una riga blu al centro.

profondità, color, ras, wrl, wrl2, ech, excel, sti.



leo2150 è una poesia di Leopardi con un leggero stropicciamento.

profondità, color, ras, wrl, wrl2, ech, excel, sti.



leo3150 è una poesia di Leopardi con un pesante stropicciamento.

profondità, color, ras, wrl, wrl2, ech, excel, sti.



leocil150 è la poesia di Leopardi sul cilindro.

profondità, color, ras, wrl, wrl2, ech, excel, sti



quadri2150 è una quadrettatura con un leggero stropicciamento.

profondità, color, ras, wrl, wrl2, ech, excel, sti.



quadri3150 è una quadrettatura con un pesante stropicciamento.

profondità, color, ras, wrl, wrl2, ech, excel, sti.



quadricil150 è la quadrettatura sul cilindro.

profondità, color, ras, wrl, wrl2, ech, excel, sti.





Altre informazioni sul sito dell'Università dell'Insubria: http://web.crii.uninsubria.it/crii/Progetti/Books/index.htm.

Per qualsiasi ulteriore informazione potete scrivermi: maury@maury.it



Ringraziamenti >>>

Creative Commons License

Statistiche di accesso




 Use OpenOffice.org