Beğenin ya da beğenmeyin, yapay zekâ arşivlere girdi. Artık arşivcilerin ipleri ele alma zamanı.

Emilie Hardman

3 Nisan 2026

Arşiv mekânı, Salt Galata, 2016
Fotoğraf: Mustafa Hazneci

Kronik kaynak kısıtları arşivcilerin birincil kaynakları kullanıcılar için okunabilir hâle getirme kapasitesini azalttı. Yapay zekâ bu krizi daha da şiddetlendirebilir ya da bir çıkış yolu sunabilir.

Arşivlerin tanımlanması her zaman biriktirme esasına dayalıdır. Arşiv biliminin doğuşuna öncülük eden Avrupa bürokrasisinin uçsuz bucaksız kayıtları başka türlü nasıl yönetilebilirdi ki? Analog dönemde, bilgilerin derlenmesi ve özet bir şekilde tanımlanması erişim için bir zorunluluktu. Zamanla arşivciler bu yaklaşımı, “gerektiği kadar, yeterince” tanımlama sanatı olarak benimsediler: Bu da, kanıtların korunması ile sınırlı kaynaklar arasında denge tutturmaya yönelik incelikli bir emek demekti.

Ancak son on yıllarda, süregelen kaynak kısıtlamaları birçok veri havuzunu bu aşamayı atlayıp hızlı bir sınıflandırma yapmaya itmiş; tanımlamayı zayıflatarak neyin yeterli sayılacağına dair eşiği yeniden belirlemiştir. Şimdi önümüzdeki soru şu: Aşağı çekilen eşiği yeni normal olarak kabul edecek miyiz, yoksa tanımlama kapasitesini yeniden inşa ederek, yapay zekânın keşif ve yorumlamanın olağan bir parçasına dönüştüğü bir ortamda, giderek daha fazla araştırmanın yürütüldüğü dijital sistemlerde birincil kaynakları okunabilir hâle getirebilecek miyiz? Bu, arşivciliğin geleceğiyle ilgili bir sorudur.

Okunabilirlik meselesi, neyin “yeterli” olduğuna dair algımıza bağlıdır. 2024’te, JSTOR Stewardship için arşivlerin ve özel koleksiyon çalışmalarının mevcut durumu hakkında bir rapor hazırladım. Saha çalışmam sırasında, arşiv işleme ekipleri sık sık “golden minimum” [altın asgari] kavramından bahsetti. Öncülü “More Product, Less Process”ten [Daha Fazla Ürün, Daha Az Süreç]¹ daha gösterişli bir isme sahip olan bu kavram, kısıtlı koşullar altında temel kullanım için yeterli olan tanımlamayı ifade eder. Çoğu referans arşivcisi ya da özel koleksiyon kütüphanecisinin de doğrulayacağı gibi sorun, temel kullanım için yeterli olanın her zaman gerçekten de yeterli olmamasıdır.

Bozuk Tanımlama İskeletleri

Dijital ortamlarda “altın asgari” ile kullanıcıların gerçek ihtiyaçları arasındaki uyumsuzluk, analog ortamlara kıyasla daha belirgindir. Arşivciler tarafından erişilebilir olarak değerlendirilen materyaller, kullanıcılar tarafından bulunamıyorsa fiilen erişilemez demektir. Bu sorun herkesçe biliniyor, ancak bununla ilişkili henüz yeterince konuşmadığımız bir mesele var: Kullanıcılar araştırmalarına dair bir veri bulduklarında, gördüklerini anlamlandırmak için her zaman yeterli bilgiye sahip olmayabilirler. (“Kullanıcılar” derken kendimi de kastediyorum.) Aranabilir dijital birincil kaynaklar, yeterli açıklama sağlanmadığında, özellikle de koleksiyona ilişkin isim, terim ve bağlam bilgisine sahip olmayanlar için kullanışlı olmayabilir. Örneğin yakın zamanda HIV, AIDS ve sanat odaklı bir dijital koleksiyonda neden Truman Capote’nin bir öyküsünün çıktısıyla karşılaştığımı anlamamıştım. Bunun elbette kültürel açıdan önemli nedenleri var, ancak o an böyle bir karşılaşma tam anlamıyla anlaşılmazdı.

Bu kafa karışıklığı tesadüfi değil; uzun süredir ayrıntılı anlaşılabilirlikten ziyade bulunabilirliği önceliklendiren bir keşif modelinin öngörülebilir bir sonucu. Dijitalleştirme bu sorunu yaratmadı; ancak görünür hâle getirdi. Bir arama rehberinin bağlamsal çerçevesi içinde anlam, provenans ve soyağacının hiyerarşik mantığıyla oluşur. Fiziksel arşivlerden alınan veriler başka sistemlere aktarıldığında ve tekil ögeler hâlinde karşımıza çıktığında, tanımlama çoğunlukla tanımlama işlevini yitirir. Çevrimiçi bir koleksiyon yanlış yorumlanmaya açık olabilir; bunun nedeni birinin işini eksik yapması değil, açıklayıcı ipuçlarının tek başına anlam ifade edecek şekilde tasarlanmamış olmasıdır. Sözgelimi “1989” gibi bir klasör etiketi bir arama rehberinde yeterli olabilir, ancak kullanıcının karşısına çıkan dijitalleştirilmiş bir belgeyi yorumlamasına pek yardımcı olmaz. Örneğin New York’un ünlü “Rollerena Fairy Godmother”ının bir gösterisine ait tanıtım broşürünün, çevrimiçi ortamda sunulduğunda anlaşılabilir olması için daha kapsamlı bir açıklamaya ihtiyaç vardır.

Yapay zekânın içine giriş yaptığı arşiv ortamı budur. Bu elbette bir teknoloji değişimidir, ama aynı zamanda iki önemli değişikliğin de koşullarını yaratır: Arşivcilerin rolünün dönüşümü ve birincil veri kullanıcılarının yeni beklentileri. Yapay zekâ, arşivcilerden talep edilen çıktıları, yöneticilerin beklentilerini ve kullanıcıların neyin mümkün olduğuna dair varsayımlarını değiştirecek. Bu yeni beklentiler, destek artırılmadan talepleri yükselterek arşivlerdeki kapasite krizini derinleştirebileceği gibi, geniş kapsamlı birincil kaynakların akademik araştırma ekosistemi içindeki yeni merkezî konumu ve kamu yararı etrafında arşivciliğin yeniden şekillenmesine de katkı sağlayabilir.

Bundan sonra ne olacağı, arşivlerin “yapay zekâyı benimseyip benimsememesi”ne değil; yapay zekâ araçlarının hesap verebilirlik, bağlam ve özeni koruyacak şekilde kullanıcı odaklı amaçlara yönlendirilip yönlendirilmeyeceğine bağlı.

Yapay Zekâyı Arşivlere Entegre Etmek

Arşivlerde ve özel koleksiyonlarda yapay zekânın yararlarına ilişkin her türlü dürüst tartışma, bu alanın yapay zekâya yönelik düşmanlığını kabul edip bağlamına oturtmakla başlamalıdır. Pek çok kesimde bu tepki, hafif bir şüphecilikten ibaret değil. Örneğin AI for Access [Erişim İçin Yapay Zekâ] projesi kapsamında paylaşılan, yazarlarının “veri olarak içgüdüsel tepkiler” olarak adlandırdığı anket çalışmasındaki katılımcı yorumları arasında “Yapay zekâ insan ruhuna zarar verir” gibi keskin ifadeler yer alıyor. Hatta “[yapay zekâ] araçları saçmalıktır” gibi daha sert ifadeler de var. Bazıları ise birden fazla kaygıyı tek bir yargıya indirgeyerek yapay zekâyı, “çevreyi tahrip eden, emeği değersizleştiren, güvenilmez bir çöp” olarak tanımlıyor.

Bu coşkulu ifadeler sadece retorik bir öfke değil; muhtemelen mesleki bir hafızanın da ürünü ve arşivciler ile kütüphanecilerin defalarca deneyimlediği bir durumu yansıtıyor: İş gücünün yerini alan teknoloji, yeterli denetim olmaksızın temin edilen araçlar ve yatırım kesintilerini meşrulaştırmak için kullanılan verimlilik söylemleri. Bir yandan da hassas kişisel bilgiler içeren koleksiyonlardaki gizlilik ve gözetim riskleri, belgelenmiş önyargı ve temsilî zarar, verilerin sömürülmesine dayalı uygulamalar, çevresel maliyetler gibi somut ve haklı endişeleri akla getiriyor. Hepsinin ötesinde, arşivsel tanımlamanın sadece metin üretimi olmadığına dair mesleki bir inanç da söz konusu. Bu da, muhakeme, bağlam oluşturma ve kayıtların nasıl kullanılabileceğine dair sorumluluk anlamına geliyor.

Tüm bu nedenlerden ötürü, söz konusu tepkiler azimle veya zorla aşılması gereken bir engelden ziyade, neyin başarısız olacağını gösteren bir kısıtlama olarak değerlendirilmeli. Yapay zekâ, verimlilik odaklı bir zorunluluk olarak ele alınırsa, muhakeme gerektiren işleri içerik üretimine indirgeyecek, güven yerine hacmi ödüllendirecek ve kurumları itibarlı görünen ancak itibar kazanmamış metinler yayımlamaya yöneltecektir.

Mevcut tepkiler, alandaki uzmanların teknolojinin hizmet yerine ikame olarak sunulduğunda neler olduğunu deneyim yoluyla öğrendiklerinin de bir göstergesidir. Bu ders günümüz için önemli, zira yapay zekâ akademi ve eğitim ekosisteminin ayrılmaz bir parçası hâline gelmiş durumda. Sorulması gereken, akademisyenlerin ve öğrencilerin arşiv materyallerini keşfederken yapay zekâ destekli araçlarla karşılaşıp karşılaşmamaları değil; zaten karşılaşıyorlar. Asıl soru, birincil kaynakların bu ekosistem içinde okunabilir olup olmayacağı ve arşivcilerin bu ekosisteme önemli katkılar sağlayan uzmanlar olarak nasıl hareket edebileceği.

Yapay Zekâyı Arşivsel Amaçlara Yönlendirmek

Arşiv ve özel koleksiyon alanındaki uzmanlar, yapay zekânın arşiv kayıtlarıyla nasıl kesişeceğini şekillendirmezlerse, bunu başka sistemler yapacaktır. Bu sistemler ise zaten iyi tanımlanmış, standartlaştırılmış ve insan denetimi olmadan işlenebilecek kadar “temiz” olan kayıtları önceliklendirecektir. Sonuç, arşivlerin aniden ortadan kaybolması değil, sessizce görünmezliğe doğru yol alması olacaktır. Bu durumda birincil kaynaklar, genel erişim için derlenmiş kaynaklara göre daha zor yorumlandığı için öğretim ve araştırmada daha az yer bulacak; arşiv araştırmaları, sistemlerin destekleyemediği yorumlama işini üstlenebilecek metodolojik eğitime, zamana ve kurumsal erişime sahip kişilerin elinde toplanacaktır.

Bundan sonra arşiv çalışmalarının başarısı, yalnızca arşivlerin dijital olarak erişilebilir olup olmamasına değil, aynı zamanda kullanıcıların karşılaştıkları içerik hakkında yönlendirme ve netlik bekledikleri arayüzlerde ve geniş ölçekte kullanılabilir olup olmamasına göre değerlendirilecektir. Yapay zekâ, gerekli değişimleri gerçekleştirmenin tek yolu olmasa da, bizi bu noktaya getiren kronik kısıtlılık ortamına verdiğimiz tepkiyi yeniden şekillendirmek için en önemli fırsatlardan birini sunar. Gelecek, kısıtlardan ziyade fırsatlara verilen bir yanıt olabilir. Dahası, kökten değişen bir dünyada tanımlama, bağlam, ilişkilendirme ve genel koruma sorumluluğuna yönelik yeni bir kapasite anlayışıyla hareket ederek, birincil kaynakları akademik araştırma ekosisteminin merkezine yerleştirecek adımlar atmaya çalışabiliriz.

Eğer hedef buysa, bunun ne olmadığını açıkça söylemek iyi olacak. Bu, yapay zekânın arşivsel tanımlamayı nihayet “tamamlamamıza” olanak sağlayacağına dair bir vaat ya da belge düzeyinde eksiksizlik hayali değildir. Yönetim kademesinin desteği artırmadan daha fazla çıktı talep etmesi için bir “izin belgesi” de değildir ve öyle anlaşılmamalıdır. Şu anda en cazip vaat hız; yapay zekâ genellikle birikmiş iş yükü sorunu için bir çözüm olarak sunuluyor. Sınırlı imkânlar ile ertelemenin şekillendirdiği bir alanda bu söylemin neden kabul gördüğünü anlamak zor değil. Ancak “verimlilik” esas hikâye hâline gelirse, bu sektör sonuçlar üzerindeki kontrolünü yitirecektir. Temel mesele, arşivlerin daha fazla tanımlamayı ne kadar hızlı üretebileceği değil. Asıl soru, kullanıcıların birincil kaynakları geniş ölçekte bulup bulamayacağı, anlayıp anlayamayacağı ve sorumlu bir şekilde yorumlayıp yorumlayamayacağıdır.

Okunabilirlik, erişim ile kullanım arasındaki köprüdür; bir kaydı parçalı olarak görmekle bir kanıt olarak görmek arasındaki farktır. Bu fark, çoğu zaman şaşırtıcı derecede küçük müdahalelerle ortaya çıkar.

İşte bu noktada, yazının başında sözünü ettiğim Truman Capote hikâyesi, kişisel bir kafa karışıklığından bir teşhis aracına dönüşür. Tek başına tuhaf bir edebî efemera gibi görünürken, bir dizi ilişkisel ipucu bu karşılaşmayı değiştirir: Nitekim bu materyal, Robert Coffman belgelerinin bir parçasıdır. San Francisco’da, ABD’nin en eski kuir tiyatrosu olan Theatre Rhinoceros’un oyuncularından Coffman, AIDS krizi sırasında her yıl bayramlarda düzenlenen Capote okuma etkinliklerini bağış toplamak için kullanıyordu. Bu etkinlikler, kayıpların ve derin bir yasın damga vurduğu bir dönemde, hem bir buluşma alanı hem bir bağış platformu hem de teselli edici bir kültürel devamlılık sağlamıştı. Krizin bu boyutu tek bir belgeden anlaşılamaz, ancak küçük bağlamsal ipuçları bile güçlü nüanslar sunar ve kriz hakkında hızla yeni bir şeyler ortaya koyar. Kayıt değil; yorumlama koşulları değişmiştir. Burada yapay zekânın değeri, belgeyi “anlamasında” değil; onu okunabilir kılan isimleri, bağlantıları, olayları ve kurumsal ilişkileri hızlı ve kolay bir şekilde açığa çıkarmaya yardımcı olabilmesindedir.

Eğer birincil kaynakları akademik araştırma ekosisteminin merkezine yerleştirmek konusunda ciddiysek, bu tür bir dönüşümün yaygınlaşması gerekir: Her karşılaşmanın sorunsuz olması gerektiği için değil; çok fazla karşılaşma yanlış türde bir engel nedeniyle tıkandığı için. Bu, yorumlamanın üretken zorluğundan ziyade ilişkisel ve bağlamsal ipuçlarının eksikliğinden kaynaklanan, önlenebilir bir belirsizliktir.

İlişkisel Tanımlama

Elbette, bu tür ipuçları hâlihazırda arşiv kayıtlarında yer almıyor; tıpkı Coffman’ın arşivindeki iki kutu fotoğrafı tanımlamak için yalnızca “fotoğraflar düzenlenmemiştir” gibi birkaç ifadenin kullanılmış olması gibi. Dünyada buna yetecek ne zaman ne de kaynak var. Sonuç, yüzeysel bir tanımlamanın ötesinde, yetersiz bir ilişkisellik; yani okuyucuya bir belgenin nereye ait olduğunu, neyle yan yana geldiğini ve hangi yorumlama çerçevesinin onu okunabilir kıldığını anlatan ipuçlarının yokluğudur.

İlişkileri birinci mevkiye taşıma arzusu yeni bir şey de değildir, naif bir “bağlantılı veri” hayali de. Encoded Archival Context for Corporate Bodies, Persons, and Families [Kurumsal Yapılar, Kişiler ve Aileler için Kodlanmış Arşivleme (EAC-CPF)², aktörleri ve aralarındaki ilişkileri yalnızca anlatımsal tanımlamalara gömülü isimler olarak değil, varlıklar olarak tanımlanabilir hâle getirdi. Records in Contexts [Bağlam İçindeki Kayıtlar] (RiC) ise bu ilişkisel mantığı genişleterek arşivsel tanımlamanın hiyerarşik yapılar yerine varlıklar ve ilişkiler etrafında inşa edilmesini öneriyor. Buradaki mesele standartları sırf standart olsun diye koymak değil. Asıl mevzu taşınabilirlik: Sistemler arasında dolaşabilen, farklı koleksiyonlarda varlığını sürdüren ve kullanıcı için keşif ve yorumlama yolları açabilen ilişkiler.

En büyük engel her zaman operasyonel olmuştur. İlişki açısından zengin tanımlamaları oluşturmak ve sürdürmek emek yoğun bir süreçtir. Ayrıca eşitsiz bir iş yükü söz konusudur; kapasite bazı ortamlarda yoğunlaşırken diğerlerinde yoktur. Yapay zekâ, uzmanların kabul edebileceği, reddedebileceği ve geliştirebileceği olası ögeler ve bağlantılar önermede büyük potansiyele sahiptir. Aynı zamanda, başka türlü mümkün olmayacak ölçeklerde erişim noktaları oluşturulmasına da yardımcı olabilir. Sözcük dağarcığını zenginleştirebilir; kalıplar önerebilir. Amaç, ilişkilerin yönlendirici unsurlar olarak öne çıktığı keşif sürecinin daha çok araştırma gibi işlemesidir.

Eylemli (Agentic) Sistemler

Bugüne dek arşivler ve özel koleksiyonlarda yapay zekâ ile ilgili tartışmaların büyük bir kısmı üretken modellere odaklanmıştır. Ancak yapay zekâ geliştirme, çok aşamalı işleri yapan sistemlere doğru kaymaktadır. Bu sistemler, tekrarlı bir şekilde verileri toplar, seçenekleri karşılaştırır, araçları devreye sokar ve farklı aşamaların çıktılarını bir araya getirir. Bu yaklaşımlar bütünü, “eylemli yapay zekâ” olarak adlandırılır.

Birincil kaynak araştırması nadiren tek bir sorguyla halledilebilir. Araştırmacılar çaprazlamalar yaparak ilerler. Terimleri dener. Bir ismin peşinden gider, ardından varyantlarını arar, ilgili kuruluşları inceler, bir tarihin belgenin oluşturulduğu tarih mi yoksa gösterdiği olayın tarihi mi olduğunu anlamaya çalışır. Sonra da ne tür bir kayıtla uğraştığını anlamak için serinin bağlamını gözden geçirir. Geleneksel arama, bu süreci çoğu zaman parçaların geri getirilmesine indirgeme eğilimindedir. Özerk eylem kapasitesine sahip sistemler ise—en azından prensipte—uzman yönlendirmesine yakın bir yaklaşımı destekleyebilir.

Ancak bu tür eylemli sistemler, sadece metin üretmedikleri için riski de artırır. Önemli olan şeylerin bir dökümünü çıkarırlar. Böyle bir sistem bağlamı, ardındaki oluşum sürecini göstermeden sunduğunda, hesap verebilirliğin yerini tutarlılık alabilir. Bu yapı ne kadar akıcı hâle gelirse, kullanıcıların onu otoriteyle karıştırması da o kadar kolaylaşır.

Önümüzdeki İşler

Analog dünyada arşivle karşılaşma, tanınabilir biçimler ve uygulamalar aracılığıyla gerçekleşiyordu. Arama rehberi talep fişi için veri sağladığı gibi, kullanıcılara belirsiz malzeme yığınlarının içindeki olasılıkları nasıl keşfedeceklerini de öğretirdi. Araştırma mekânı yorumlama için sosyal ve prosedürel bir çerçeve sunar; referans hizmeti canlı bir oryantasyon biçimi sağlardı: Araştırmacının sorusu ile arşivin yapısı arasında, bağlamın oluşturulduğu, terimlerin test edildiği ve materyallerin kullanılabilir hâle geldiği tekrarlı bir çeviri süreci. Bu yapılar, zorluğu ortadan kaldırmasa da onu üretken kılar ve arşivcileri anlamlı yollarla sürecin merkezinde tutardı.

Şu anda ortaya çıkan şey, tamamlanmış bir teknoloji düzeni değil, dijital sistemlerin karşılaşma anında ne sunması gerektiğine dair değişen beklentilerdir. Bu beklentiler de özünde sorunsuz erişimden ziyade daha fazla kapasiteye yönelik bir talebe işaret eder: Materyallerin, çoğu zaman erişilebilirliği geciktiren haklar, izinler ve etik meseleleri görünür kılacak biçimde, geniş ölçekte incelenmesi; daha zengin bağlamlar; daha güçlü bağlantılar; kullanıcıların bulduklarını yorumlamalarına yardımcı olacak destek biçimleri. Arşivler bu beklentilere yalnızca miras aldıkları kısıtlamaları savunarak karşılık verirse, aşina olduğumuz biçimleri korurken, akademik ilginin giderek daha fazla örgütlendiği alanı başkalarına bırakmış olacağız.

Yapay zekâ, birincil kaynak kaydının değerini yeniden ölçeklendirmek ve ortaya koymak için bir fırsattır. Bu durumda arşiv çalışmalarının odağı, makine destekli süreçlerin hangi koşullar altında işlediğini belirlemeye doğru kayar. Yapay zekâyla etkileşim, ne yeniliğe kayıtsız şartsız teslim olmak ne de hız ve verimlilik peşinde zoraki bir hamle yapmak anlamına gelir. Aksine, mesleki hayal gücünün ufku olarak görülen “altın asgari”lerden çıkmanın bir yoludur. Aynı zamanda, arşiv çalışmalarını araştırma ekosistemine yönelik yenilenmiş bir katkı olarak ele alma imkânı sunar ve bu katkının—veri depolarının şimdiye dek nadiren kaynak ayırabildiği ölçekte—okunabilirliği, bağlamı ve sorumlu kullanımı destekleyebilecek altyapılara dönüştürülmesini mümkün kılar.

Sezin Romi ve Vasıf Kortun tarafından Türkçeleştirilen bu yazının İngilizce aslı, 19 Mart 2026’da Katina dergisinde yayımlanmıştır.

1.
"Daha Fazla Ürün, Daha Az İşlem" (MPLP), 2005 yılında Mark A. Greene ve Dennis Meissner tarafından ortaya atılan bir arşiv yönetim stratejisidir. Bu metodoloji, araştırma amaçlı erişimi, belge düzeyinde tanımlama ve kapsamlı fiziksel koruma çalışmalarından daha öncelikli kılarak, arşivlerde işlenmemiş tarihî kayıtların birikmesini ele alır. Geleneksel arşiv uygulamaları genellikle tek tek belgelerin kataloglanması gibi görevleri içerirken, MPLP bu odağı seri veya kutu düzeyinde toplu işleme kaydırır ve mümkün olduğunda orijinal düzeni ve yerleşimi korur. Kurumlar, bu minimalist standartları benimseyerek daha büyük hacimli materyaller için temel bir keşif düzeyi sağlamayı hedefler. Bu uygulama birikmiş iş yükünü azaltırken, kayıtların uzun vadeli fiziksel istikrarı ve araştırmacıların erişebileceği detay düzeyi uzmanlar arasında tartışma konusu olmaya devam etmektedir. (ç.n.)
2.
"Kurumsal Yapılar, Kişiler ve Aileler için Kodlanmış Arşivleme" (EAC-CPF), arşiv kayıtlarını oluşturan, yöneten veya bunlarla ilişkili olan varlıklar (birey, aile veya kuruluşlar) hakkındaki bilgileri kodlamak için kullanılan uluslararası bir teknik standarttır. Kayıtların içeriğinden ziyade kayıtların oluşturulduğu bağlamı yakalamak üzere tasarlanmış özel bir "XML şeması" işlevi görür. Bu ayrım, arşivleme teorisinin temelini oluşturur. Kaydın tanımını kayıt oluşturan kişinin tanımından ayıran bu sürece genellikle "yetki kontrolü" denir. (ç.n.)

BLOG

