TIM digitalizacija - potek
Objavljeno: 30 Avg 2021, 18:08
Da vam predstavim kako sem si zamislil se lotit realizacije digitalizacije revije TIM.
Zagotovo bo kdo imel občutek dĂ©jĂ vu, saj isto temo imam še odprto na www.s5tech.net ter www.elektronik.si
Pri nasvetih/predlogih prosim upoštevajte, da za ta projekt raje vložim več časa kot €
& Nimam na voljo delavnice("delavnica"==garsionera+balkonček)
Faze:
1 - zbiranje revij
2 - uradni dogovor na kak način je objava dovoljena
3 - izdelava orodja za zajem
4 - digitalizacija revij
5 - OCR
6 - digitalizacija prilog načrtov (A2)
7? - vektorizacija načrtov (ne poznam nobene opensource rešitve, ki naredi uporaben dxf)
8 - se dogovorit z COBISS za pridobitev seznama vseh zabeleženih avtorjev in naslovov člankov, za izdelavo kazal
9 - uvoz obstoječih uradnih digitalnih izvodov
10 - postavitev strežnika za objavo skladno z točko 2
11 - popravki morebitnih slabih zajemov / manjko (zagotovo načrti prilog)
Posebnosti TIM:
- različni formati ~A5 in ~A4
- letnik je orientiran na šolsko leto torej začne v enem in konča v drugem koledarskem
- letnik je 9 ali 10 številk , bilo zgleda tudi nekaj izjem z manj
- pri nekaterih številkah je priloga A2 (nimam podatka od katerega letnika je priloga stalnica)
- vsebina ni le besedilo in slike temveč tudi načrti
FAQ:
Zakaj to počneš?
Že dolgo imel ta cilj, v prejšnji službi kot učitelj videl da bi to še kako prav prišlo, nihče pa se tega v takem obsegu še ni lotil.
Mogoče pa sem le konkretno preveč usekan.
Misliš s tem služiti?
Ne ne mislim!
Zakaj tega še ni uredništvo naredilo?
€€€ Kolikor mi je znano se revija zadnja leta ravno, da se drži.
Prejšnji založnik(TZS?) bi jo ukinil, zato sedaj izhaja pod ZOTKS
Zakaj hočeš celo fizično zbirko?
Ne dvomno bo pri taki masi prišlo do kakega slabega zajetja, če imam izvod pri roki lahko tisti del ponovno digitaliziram.
In ja če to delam kot hvala lepa, bi bil vesel da imam tudi fizično zbirko
Če zajemam vse na isti napravi bo kvaliteta zajema skozi vse enaka
Ždet ure po šihtu v knjižnici, še posebej z masko se mi res ne ljubi
Vodit evidenco pri komu sem si sposodil kateri izvod ni ravno zabavno.
Kako dolgo bo trajalo?
Niti nočem računati da ne zgubim motivacije, če boš računal prosim obdrži zase.
Nimam ciljnega datuma.
Faza 1 - Zbiranje revij
Prvotno sem zbrane revije vodil v txt, nato tabelci a se je izkazalo za nezanesljivo.
Izdelal sem si preprosto stojalo za fotografiranje platnic (casio ex-zr200)
Vsak letnik je na disku kot mapa
Mapa vsebuje slike vseh platnic tistega letnika, ki jih imam tudi podvojene
Poimenovani so TIM1,TIM2... če je številka podvojena dobi zadaj - npr TIM1-, potrojena -- itd
Manjhna PHP skripta na malinci se sprehodi skozi mape in v kombinaciji z CSS se izriše pikaz viden na
https://tim.izdelal.si , da je prikaz hitrejši je še ena mapa kjer so vse platnice še močno pomanjšane.
Faza 3 - orodje za zajem
A) Ploski skener (razen za priloge) odpade ker
- rezat revij nimam namena, jih je preveč škoda in tudi papirji so različne kakovosti prepričan sem da bi jih par samodejni podajalec uničil.
- nekateri izvodi so zelo krhi, tukaj sem dal revijo na ploskega pa je bilo slišat pokanje šivov, ni škode a dvomim da bi ostala cela če bi vse strani tako delal.
- imam tudi letnike, ki so vezani z trdimi platnicami
- nekatere številke (ponavadi 9-10) so opazno debelejše v skrajnih točkah pride do popačenja
B) Dat nekomu profesionalno skenirat revije... nisem preverjal sem precej prepričan da bo dražje kot izdelava naprave... in kaj takrat če kak zajem ni dober ?
C) izdelat si mislim nekaj takega https://www.diybookscanner.org/
- rabim nabavit 2 identični kameri kateri še se nisem odločil
Bolj točno "Archivist Quill" načrti sicer niso javni, kit ni za dobit
a prodajalec se mi je odzval in brezplačno podal podatke o dolžinah profilov, navodila za gradnjo pa so že javna na http://tenrec.builders/quill/guide/
(profilov imam verjetno dovolj od razdrtega projekta)
Faza 5 - OCR
Zelo verjetno: https://github.com/manisandro/gImageReader
ki sem ga slučajno že testiral za potrebe službe ter spotoma še vmesnik prevedel v Slovenščino
Zagotovo bo kdo imel občutek dĂ©jĂ vu, saj isto temo imam še odprto na www.s5tech.net ter www.elektronik.si
Pri nasvetih/predlogih prosim upoštevajte, da za ta projekt raje vložim več časa kot €
& Nimam na voljo delavnice("delavnica"==garsionera+balkonček)
Faze:
1 - zbiranje revij
2 - uradni dogovor na kak način je objava dovoljena
3 - izdelava orodja za zajem
4 - digitalizacija revij
5 - OCR
6 - digitalizacija prilog načrtov (A2)
7? - vektorizacija načrtov (ne poznam nobene opensource rešitve, ki naredi uporaben dxf)
8 - se dogovorit z COBISS za pridobitev seznama vseh zabeleženih avtorjev in naslovov člankov, za izdelavo kazal
9 - uvoz obstoječih uradnih digitalnih izvodov
10 - postavitev strežnika za objavo skladno z točko 2
11 - popravki morebitnih slabih zajemov / manjko (zagotovo načrti prilog)
Posebnosti TIM:
- različni formati ~A5 in ~A4
- letnik je orientiran na šolsko leto torej začne v enem in konča v drugem koledarskem
- letnik je 9 ali 10 številk , bilo zgleda tudi nekaj izjem z manj
- pri nekaterih številkah je priloga A2 (nimam podatka od katerega letnika je priloga stalnica)
- vsebina ni le besedilo in slike temveč tudi načrti
FAQ:
Zakaj to počneš?
Že dolgo imel ta cilj, v prejšnji službi kot učitelj videl da bi to še kako prav prišlo, nihče pa se tega v takem obsegu še ni lotil.
Mogoče pa sem le konkretno preveč usekan.
Misliš s tem služiti?
Ne ne mislim!
Zakaj tega še ni uredništvo naredilo?
€€€ Kolikor mi je znano se revija zadnja leta ravno, da se drži.
Prejšnji založnik(TZS?) bi jo ukinil, zato sedaj izhaja pod ZOTKS
Zakaj hočeš celo fizično zbirko?
Ne dvomno bo pri taki masi prišlo do kakega slabega zajetja, če imam izvod pri roki lahko tisti del ponovno digitaliziram.
In ja če to delam kot hvala lepa, bi bil vesel da imam tudi fizično zbirko
Če zajemam vse na isti napravi bo kvaliteta zajema skozi vse enaka
Ždet ure po šihtu v knjižnici, še posebej z masko se mi res ne ljubi
Vodit evidenco pri komu sem si sposodil kateri izvod ni ravno zabavno.
Kako dolgo bo trajalo?
Niti nočem računati da ne zgubim motivacije, če boš računal prosim obdrži zase.
Nimam ciljnega datuma.
Faza 1 - Zbiranje revij
Prvotno sem zbrane revije vodil v txt, nato tabelci a se je izkazalo za nezanesljivo.
Izdelal sem si preprosto stojalo za fotografiranje platnic (casio ex-zr200)
Vsak letnik je na disku kot mapa
Mapa vsebuje slike vseh platnic tistega letnika, ki jih imam tudi podvojene
Poimenovani so TIM1,TIM2... če je številka podvojena dobi zadaj - npr TIM1-, potrojena -- itd
Manjhna PHP skripta na malinci se sprehodi skozi mape in v kombinaciji z CSS se izriše pikaz viden na
https://tim.izdelal.si , da je prikaz hitrejši je še ena mapa kjer so vse platnice še močno pomanjšane.
Faza 3 - orodje za zajem
A) Ploski skener (razen za priloge) odpade ker
- rezat revij nimam namena, jih je preveč škoda in tudi papirji so različne kakovosti prepričan sem da bi jih par samodejni podajalec uničil.
- nekateri izvodi so zelo krhi, tukaj sem dal revijo na ploskega pa je bilo slišat pokanje šivov, ni škode a dvomim da bi ostala cela če bi vse strani tako delal.
- imam tudi letnike, ki so vezani z trdimi platnicami
- nekatere številke (ponavadi 9-10) so opazno debelejše v skrajnih točkah pride do popačenja
B) Dat nekomu profesionalno skenirat revije... nisem preverjal sem precej prepričan da bo dražje kot izdelava naprave... in kaj takrat če kak zajem ni dober ?
C) izdelat si mislim nekaj takega https://www.diybookscanner.org/
- rabim nabavit 2 identični kameri kateri še se nisem odločil
Bolj točno "Archivist Quill" načrti sicer niso javni, kit ni za dobit
a prodajalec se mi je odzval in brezplačno podal podatke o dolžinah profilov, navodila za gradnjo pa so že javna na http://tenrec.builders/quill/guide/
(profilov imam verjetno dovolj od razdrtega projekta)
Faza 5 - OCR
Zelo verjetno: https://github.com/manisandro/gImageReader
ki sem ga slučajno že testiral za potrebe službe ter spotoma še vmesnik prevedel v Slovenščino