Keskaegsete juudi käsikirjade digitaalne revolutsioon

  • Rahvusvaheline projekt edendab sadade tuhandete keskaegsete juudi käsikirjade automaatset transkriptsiooni, mille keskmes on Kairo Genizah.
  • Iisraeli Rahvusraamatukogu ja Ktiv platvorm juhivad tekstide digiteerimist ja avatud avaldamist, mida toetab Euroopa Teadusnõukogu rahastus.
  • MiDRASH algatus ühendab tehisintellekti ja humanitaarteadused, et rekonstrueerida keskaegset juudi kirjanduskultuuri ja hõlbustada uusi akadeemilisi uuringuid.
  • Koostöös toimuvad transkriptsiooni- ja ülevaatusseansid võimaldavad tehisintellekti mudeleid täiustada ning avada arhiivi teadlastele ja avalikkusele kogu maailmas.

keskaegsed juudi käsikirjad

Tohutu kollektsioon keskaegsed juudi käsikirjad Kairo Genizah, nagu seda kutsutakse, kogeb tehisintellekti tõttu pöördelist hetke. Pärast aastakümneid, mil materjalist oli hõlpsasti ligipääs vaid väikesele osale, on ... kombinatsioon massiline digitaliseerimine Ja tekstituvastussüsteemid hakkavad seda ainulaadset arhiivi teadlastele ja laiemale avalikkusele tõeliselt avama.

See, mis kuni viimase ajani tundus filoloogide ja ajaloolaste unistusena – võime otsi, loe ja võrdle Idee muuta sajad tuhanded keskaegsed heebrea katked kättesaadavaks igast arvutist on saanud konkreetseks projektiks. Iisraeli Rahvusraamatukogu Ktiv platvormi ja MiDRASH programmi kaudu on loodud praktiliselt kõigi Genisa fragmentide esialgsed transkriptsioonid ning praegu käivad ettevalmistused nende läbivaatamiseks, täiustamiseks ja avalikuks avaldamiseks.

Hiiglaslik keskaegne arhiiv, lõpuks loetav

keskaegsete juudi käsikirjade kogu

Kõne Kairo Genizah Seda peetakse maailma suurimaks ja mitmekesisemaks säilinud keskaegsete juudi dokumentide koguks. Ligi tuhande aasta jooksul hoiustas Egiptuse pealinna juudi kogukond seal religioosseid, juriidilisi, ärilisi ja kirjanduslikke tekste, mida tänu traditsioonile mitte hävitada kirjutisi Jumala nimel ei saanud lihtsalt ära visata. Tulemuseks oli kogu, mille suurust hinnatakse tänapäeval umbes [number puudub]. 400.000 fragmenti, säilinud suuresti tänu Egiptuse kuivale kliimale.

Vaatamata olulisusele on kollektsiooni kasutatud vaid osaliselt: kuni viimase ajani oli kataloogitud vähem kui kolmandik materjalist ja vaevu 10–15%-l oli ärakiri loetav. Ülejäänud, kuigi digiteeritud ja pildi kujul kättesaadavad, olid süstemaatiliselt keerulised, kuna keskaegsete heebrea käsikirjade kursiiv- või poolkursiivkirjas lugemine nõuab palju kogemusi ja aega.

Projekti uus etapp muudab seda maastikku. Tuginedes Ktivi – Iisraeli Rahvusraamatukogu hallatava kõigi teadaolevate heebrea käsikirjade digitaalse andmebaasi – infrastruktuurile, on rahvusvaheline meeskond välja töötanud automaatsed transkriptsioonisüsteemid võimeline neid fragmente teisendama otsitav digitaalne tekstvähemalt esimeses versioonis, mida hiljem täiustatakse.

Institutsiooni avaldatud andmete kohaselt on lisaks Kairo Genizahi praktiliselt kõigi elementide kohta juba loodud esialgsed ärakirjad. tuhandeid täiendavaid heebrea käsikirju pärinevad teistest keskaegsetest kollektsioonidest. Valdkonnas, mis oli üle sajandi ükshaaval töötanud, on mastaabihüpet raske üle hinnata.

MiDRASH: tehisintellekt ja humanitaarteadused heebrea käsikirjade teenistuses

Selle ümberkujundamise keskmes on MiDRASH (tekstiliste ja kirjalike traditsioonide ränne keskaegsete heebrea kirjas käsikirjade laiaulatusliku arvutusliku analüüsi kaudu), mis on interdistsiplinaarne projekt mis koondab Iisraeli ja Euroopa spetsialiste. Algatus sai alguse 2023. aastal tänu Euroopa Teadusnõukogu kuueks aastaks eraldatud 10 miljoni euro suurusele ERC Synergy toetusele, mis oli esimene omataoline spetsiaalselt juudi uuringutele pühendatud projekt.

MiDRASHi eesmärk ei piirdu pelgalt vanade tekstide transkribeerimisega. Nagu üks selle direktoritest, professor Daniel Stökl Ben Ezra, selgitab, on ambitsioon järgmine: Raamatu keskaegse juudi kirjanduskultuuri rekonstrueerimine, jälgides, millised autorid teisi tsiteerivad, kuidas rabiinide kommentaarid (midrašid) moslemi- ja kristlike kogukondade vahel levivad või kuidas kirjalikud traditsioonid sajandite jooksul muutuvad.

Selle võimalikuks tegemiseks on meeskond otsustanud töötada avatud lähtekoodiga platvormil. ScriptoriumKäsikirjade ja pealdiste automaatseks transkriptsiooniks loodud süsteem arendab keskaegse heebrea kirja jaoks spetsiifilisi mudeleid, mida on treenitud tuhandete spetsialistide poolt aastate jooksul käsitsi koostatud transkriptsioonide põhjal. Tulemuseks on süsteem, mis suudab iidsetel piltidel ridu ja sõnu segmenteerida ning need redigeeritavaks tekstiks teisendada.

Vastutavad isikud rõhutavad, et kuigi esialgsed transkriptsioonid sisaldavad vigu – mis on ebakorrapärase käekirja, katkiste fragmentide või pleekinud tindi puhul paratamatu –, on nende praktiline kasulikkus See on tohutu: need võimaldavad teil kiiresti leida piiblilõike, Talmudi osi, kirju, lepinguid või liturgilisi tekste, mis varem nõudis kannatlikku lehekülghaaval lugemist.

Mikrofilmidest avatud platvormideni: pikk tee

keskaegsete juudi käsikirjade digiteerimine

Praegune digitaalne revolutsioon keskaegsed juudi käsikirjad See ei tekkinud eikuskilt. Iisraeli Rahvusraamatukogu ise meenutab, et juba 1950. aastal loodi peaminister David Ben-Gurioni eestvedamisel Mikrofilmile Kantud Heebrea Käsikirjade Instituut. Kuna kõigi kollektsioonide füüsiline Jeruusalemma kolimine polnud realistlik, oli lahenduseks võimalikult paljude kollektsioonide mikrofilmile jäädvustamine, pannes aluse suurele visuaalsele arhiivile.

Aastakümnete jooksul mõned neist liideti 1.500 kollektsiooni Alates 2006. aastast integreeriti Kairo Geniza materjali erinevatest allikatest nn Friedbergi Geniza projekti, mis kiirendas selle süstemaatilist digiteerimist. 2014. aastal hakkas Rahvusraamatukogu oma fotoarhiivi konverteerima veebis ligipääsetavaks digitaalseks kollektsiooniks, võimaldades esmakordselt igal kasutajal otsida ja vaadata tuhandeid heebrea käsikirju veebis.

MiDRASH tugineb otseselt sellele varasemale tööle. Kasutades Ktivi infrastruktuuri – mis on juba koondanud enamiku teadaolevatest heebrea käsikirjadest ühte andmebaasi –, rakendab meeskond algoritme automaatne õppimine tähtede, sõnade ja tekstistruktuuride tuvastamiseks. See tsentraliseeritud arhiivi ja täiustatud arvutusvahendite kombinatsioon väldib üht peamist probleemi, mis esineb teistes valdkondades, näiteks araabiakeelsete käsikirjade uurimisel, kus materjal on palju hajutatum.

Rahvusraamatukogu uurimisprojektide juht dr Tsafra Siew määratleb MiDRASHi kui tõelist käändevorm kõigile, kes töötavad keskaegsete heebrea käsikirjadega. Tema arvates ei seisne edasiminek mitte ainult juurdepääsu lihtsustamises, vaid ka selliste analüüside võimaldamises, mis tohutu ulatuse tõttu olid võimatud, kui iga dokumenti tuli käsitsi ja peaaegu üksi lugeda.

Rahvusvahelise koostöö ja transkriptsiooni töötoad

MiDRASH projekt tegutseb rahvusvahelise konsortsiumina, mis ühendab tehnilist ja humanitaarteaduslikku ekspertiisi. Vastutavate uurijate hulka kuuluvad professor Nachum Dershowitz (Tel Avivi Ülikool), dr Avi Shmidman (Bar-Ilani Ülikool) ja professor Judith Olszowy-Schlanger (Oxfordi Ülikool) ning meeskonnad Haifa Ülikoolist, Iisraeli Rahvusraamatukogust ja ... Princetoni Geniza projekt, lavastaja professor Marina Rustow.

Algatus ei piirdu kaugeltki ainult laboritööga, vaid avab ka võimalusi avalikkuse osalemiseks. 24.–27. novembrini korraldati Jeruusalemmas suurüritus, mida oli võimalik otseülekandena jälgida. „Transkribeerimismatš“ keskendus keskaegsetele ja uusaegsetele heebrea käsikirjadele kursiivis ja poolkursiivis. Nende sessioonide käigus vaatavad ja parandavad koolitatud vabatahtlikud tehisintellekti loodud transkriptsioone.

Sellel koostööl põhineval lähenemisviisil on kaks eesmärki. Ühelt poolt parandada kvaliteet ja täpsus Ühelt poolt analüüsitakse tekste endid; teiselt poolt kasutatakse inimeste tehtud parandusi tuvastusmudelite edasiseks treenimiseks, et tulevikus vigade arv väheneks ja isegi kõige problemaatilisemad käed paremini ära tuntaks. Idee seisneb selles, et süsteem õpib vähehaaval filoloogide, paleograafide ja heebrea keele spetsialistide kogunenud kogemustest.

Iisraeli Rahvusraamatukogu on teatanud, et Kairo Genizahi lõplikud ärakirjad lisatakse Ktivi ja tehakse koos ... originaalpildid iga käsikirja kohta. Sel viisil saab iga uurija võrrelda masina nähtut faksiimiles nähtavaga, säilitades läbipaistvuse ja võimaldades uusi lugemisi või tulevasi parandusi.

Uued küsimused vana loo kohta

Kui masstranskriptsiooni etapp on lõppenud, soovivad projektijuhid minna kaugemale pelgast juurdepääsust. Plaan on suuta teostada keeleline ja tekstianalüüs laiaulatuslikult: tsitaatide ahelate tuvastamine, parafraaside kindlakstegemine, ideede teekondade rekonstrueerimine või teatud teoloogiliste ja õiguslike motiivide arengu jälgimine läbi sajandite.

Praktikas tähendab see seda, et keskaegsed juudi käsikirjad lakkavad olemast pelgalt riiulitel või digitaalsetes arhiivides olevad üksikud tükid ning hakkavad toimima kui omavahel ühendatud tekstide võrgustikTehisintellekt aitab leida mustreid, sarnasusi ja kordumisi, mis puhtindividuaalsel lugemisel kaotsi läheksid, samas kui spetsialistid pakuvad ajaloolist ja filoloogilist konteksti nende seoste tähenduse tõlgendamiseks.

Mõned meeskonna erihuvid hõlmavad midrašide ehk moslemi- ja kristlike territooriumide juudi kogukondades levinud rabiinide jutustuste ja kommentaaride trajektoori jälgimist. Võimalus kaardistada, kuidas sama teksti versioonid piirkonniti või ajastul erinevad, avab ukse paremale arusaamisele... kultuurikontaktid, keskajal aset leidnud sisemised konfliktid ja doktriinilised ümbertõlgendused.

Teadlased väidavad kindlalt, et masintranskriptsioon, isegi oma ebatäiuslikkusega, on alles algus. Sellele alusele on võimalikud edasised arendused. võrdlevad uuringud sõnavara, süntaks või kirjutamisstiilid, aga ka sotsiaalsed ja majanduslikud analüüsid, mis põhinevad kirjadel, ärilepingutel või juriidilistel dokumentidel, mida seni oli vaevu süstemaatiliselt uuritud.

Globaalne mõju ja võimalused Euroopale

Kuigi projekt sai alguse ja seda koordineeritakse Iisraelist, ulatub selle mõju täielikult Euroopa akadeemilisse kogukonda. ERC Synergy toetus, mis rahastab MiDRASHi, on osa Euroopa Liidu poliitikast toetada digitaalseid infrastruktuure humanitaarteaduste jaoks ning mitmed juhtivad teadlased töötavad Prantsusmaa, Ühendkuningriigi ja teiste riikide ülikoolides.

Euroopa Vahemere ajaloo, keskaegse judaismi või klassikalise islami spetsialistide jaoks on sellise põhjaliku ja otsitava andmebaasi omamine märkimisväärne muutus. Seni oli moslemiterritooriumidel elavate juudi kogukondade elu rekonstrueerimine – kus moslemid isegi elasid – keeruline ettevõtmine. 90% keskaegsest juudi elanikkonnast— See nõudis reisimist ja piiras juurdepääsu arhiividele. Ktivi järkjärgulise avamisega muutub suur osa sellest materjalist kättesaadavaks igast ülikoolilinnakust või uurimiskeskusest.

Lisaks pakub MiDRASH-is väljatöötatud metoodika mudelit, mida saab laiendada teistele Euroopa dokumendikogudele: ladinakeelsete käsikirjade kogudest notariaalsete või kiriklike arhiivideni. Digiteerimise, automaatse transkriptsiooni ja avaliku koostöö kombineerimise idee on tekkimas. korratav marsruut säilitada ja uurida teisi halvenemisohus olevaid pärandpaiku.

Projektijuhid on kindlad, et tulemuste avaldamine eelretsenseeritud teadusajakirjades kinnistab seda lähenemisviisi akadeemiliste standardite raames. Samal ajal... avatud juurdepääs Pildid ja transkriptsioonid lubavad hõlbustada Iisraeli, Euroopa ja Ameerika ülikoolide ühist tööd, luues laiemaid uurimisvõrgustikke keskaegsete juudi käsikirjade ümber.

Kairo Genizah' ja teiste heebrea käsikirjade puhul rakendatud tehisintellekti areng muudab peaaegu käsitamatu arhiivi... elav ja laienev allikasSee, mis kunagi nõudis aastaid hoolikat lugemist, on nüüd sekunditega jälgitav, ilma et see vähendaks eksperttöö olulisust, vaid pigem vastupidi: see vabastab aega keerukamate küsimuste esitamiseks ja pärandi sügavuti tõlgendamiseks, mis vähehaaval lakkab olemast varjatud aare ja saab jagatud ressursiks ülemaailmsel tasandil.

käsikirjad-0
Seotud artikkel:
Uued leiud ja tehnoloogiad ajalooliste käsikirjade uurimisel