ETVZ

İstatistiksel Papağandan Vicdani Ortağa: Büyük Dil Modellerinde Etik Temelli Paradigma Dönüşümü

Özet

Bu çalışma, mevcut Büyük Dil Modelleri’nin (Large Language Models – LLM) yapısal sınırlılıklarını tespit etmekte ve Etik Temelli Vicdani Zeka (ETVZ) mimari çerçevesinin bu sınırlılıkları aşmadaki potansiyelini değerlendirmektedir. Günümüz LLM’leri, istatistiksel örüntü eşleştirme prensipleri üzerinde çalışan, bağlamsal anlam ve etik muhakeme kapasitesinden yoksun sistemlerdir. ETVZ projesi, Hesaplamalı Vicdan Modülü (HVM), Epistemik Hafıza Sistemi ve Dinamik Etik Risk Monitörü (DERMS) gibi dışsal katmanlar entegre ederek, mevcut modellerin pasif bilgi işleyicilerden aktif etik karar vericilere dönüşümünü önerir. Araştırma, bu entegrasyonun ontolojik, epistemolojik ve kültürel boyutlardaki dönüştürücü etkilerini analiz etmektedir.

Anahtar Kelimeler: Büyük Dil Modelleri, Hesaplamalı Etik, Epistemik Güven, Kültürel Adaptasyon, Yapay Vicdan


1. Giriş

Büyük Dil Modelleri’nin (LLM) son yıllarda gösterdiği gelişim, doğal dil işleme alanında paradigmatik bir dönüşümü temsil etmektedir. GPT, BERT, LLaMA ve benzeri mimariler, milyarlarca parametreyle eğitilerek insan benzeri metin üretme kapasitesine erişmiştir (Brown et al., 2020; Devlin et al., 2019). Ancak bu sistemlerin temelinde yatan istatistiksel olasılık hesaplama mekanizması, ciddi epistemolojik ve etik sorunlar barındırmaktadır.

Bender ve Koller (2020), LLM’lerin “anlamdan yoksun” olduğunu ve yalnızca “biçim” (form) üzerinden işlem yaptığını savunmuştur. Bu eleştiri, modellerin gerçek dünya bilgisi ve etik muhakeme yeteneklerinin yokluğuna işaret etmektedir. Marcus ve Davis (2020), benzer şekilde, bu sistemlerin “sağlam akıl yürütme” (commonsense reasoning) kapasitesinden yoksun olduğunu göstermiştir.

ETVZ (Etik Temelli Vicdani Zeka) projesi, mevcut LLM mimarilerine köklü müdahaleler önermek yerine, dışsal ve modüler etik katmanlar ekleyerek bu sistemlerin sorumlu karar mekanizmalarına dönüşmesini hedeflemektedir. Bu çalışma, ETVZ entegrasyonunun dört temel boyutta yaratacağı ontolojik değişimi incelemektedir.

2. Literatür Taraması ve Teorik Çerçeve

2.1. LLM’lerde Etik Problematiği

Mevcut LLM’lerin etik karar alma konusundaki yetersizlikleri, çok boyutlu bir problematik oluşturmaktadır. Bai et al. (2022), Anthropic’te geliştirilen Constitutional AI yaklaşımında, modellerin zararlı içerik üretiminin denetim altına alınmasını hedeflemiştir. Ancak bu yaklaşım, temelde reaktif bir filtreleme mekanizmasıdır ve proaktif etik muhakeme sağlamamaktadır.

Talat et al. (2021), LLM’lerin eğitim verilerindeki kültürel önyargıları yeniden ürettiğini ve WEIRD (Western, Educated, Industrialized, Rich, Democratic) toplumların değer sistemlerini evrenselleştirdiğini göstermiştir. Bu durum, küresel çapta adil ve kapsayıcı yapay zeka sistemlerinin geliştirilmesi önünde ciddi bir engeldir.

2.2. Halüsinasyon ve Epistemik Güvenilirlik

Ji et al. (2023), LLM halüsinasyonlarını sistematik olarak kategorize etmiş ve bu sorunun modellerin içsel yapısından kaynaklandığını ortaya koymuştur. Halüsinasyon, modelin eğitim verisinde bulunmayan veya yanlış bilgiyi yüksek güvenle üretmesi anlamına gelmektedir. Bu durum, özellikle sağlık, hukuk ve finans gibi kritik alanlarda ciddi riskler oluşturmaktadır.

2.3. Kültürel Adaptasyon ve Değer Uyumu

Sorensen et al. (2024), yapay zeka sistemlerinin değer uyumu (value alignment) problemini ele almış ve tek tip değer sistemlerinin yetersizliğini vurgulamıştır. Hofstede’nin (2001) kültürel boyutlar teorisi, farklı toplumların güç mesafesi, bireyselcilik-kolektivizm ve belirsizlikten kaçınma gibi boyutlarda önemli farklılıklar gösterdiğini ortaya koymuştur.

3. ETVZ Mimari Çerçevesi ve Bileşenleri

3.1. Hesaplamalı Vicdan Modülü (HVM)

HVM, Kantçı deontolojik etik, sonuçsalcı etik (utilitarizm) ve erdem etiği prensiplerini hesaplamalı bir çerçeveye dönüştüren hibrit bir modüldür. Her potansiyel LLM çıktısı, üç boyutlu bir etik uzayda değerlendirilir:

Deontik Boyut (D): Eylemin evrensel normlara, yasal düzenlemelere ve kategorik zorunluluklara uygunluğu değerlendirilir. Bu boyut, Kant’ın (1785) kategorik buyruğunun (categorical imperative) hesaplamalı bir temsilidir.

Sonuçsalcı Boyut (C): Mill (1863) ve Bentham’ın (1789) faydacı etik prensiplerine dayanarak, eylemin toplam fayda-zarar dengesi hesaplanır. Çok aktörlü sistemlerde (multi-agent) beklenen sonuçların toplumsal etkileri Monte Carlo simülasyonlarıyla tahmin edilir.

Erdem Boyutu (V): Aristoteles’in (M.Ö. 350) eudaimonia kavramına referansla, eylemin karakteristik mükemmellik ve kültürel değerlerle uyumu değerlendirilir.

Matematiksel Formülasyon:

E(action) = α·D(action) + β·C(action) + γ·V(action)

Burada α, β, γ kültürel bağlama göre dinamik olarak ayarlanan ağırlık katsayılarıdır.

3.2. Epistemik Hafıza Sistemi

Geleneksel LLM’ler, parametrik hafızaya dayalı statik bilgi depolama kullanır. ETVZ, bu yapıya ek olarak, Neo4j tabanlı graf veritabanı kullanarak epistemik kaynak izlenebilirliği sağlar. Her bilgi nodu şu meta-verilerle etiketlenir:

  • Kaynak Güvenilirliği (Source Reliability): Akademik dergi, resmi kurum, blog vb.
  • Zamansallık (Temporality): Bilginin güncelliği ve geçerlilik süresi
  • Doğrulama Durumu (Verification Status): Çapraz doğrulama sayısı
  • Epistemik Belirsizlik (Epistemic Uncertainty): Shannon entropisi ile ölçülen belirsizlik derecesi

Bu yapı, LLM’lerin halüsinasyon problemini önemli ölçüde azaltır ve her çıktı için epistemik gerekçelendirme sağlar.

3.3. Kontekst Analizör Modülü (CA)

CA, kullanıcı etkileşimlerinden çıkarsanan demografik, kültürel ve bağlamsal vektörleri işleyerek, LLM çıktılarını yerelleştirir. Hofstede’nin kültürel boyutları (güç mesafesi, belirsizlikten kaçınma, bireyselcilik-kolektivizm, erillik-dişilik, uzun-kısa vadeli yönelim) nicel parametrelere dönüştürülerek model yanıtları modüle edilir.

3.4. Dinamik Etik Risk Monitör Sistemi (DERMS)

DERMS, LLM-kullanıcı etkileşimlerini gerçek zamanlı izleyen ve manipülasyon, jailbreak ve etik drift girişimlerini tespit eden bir anomali dedektörüdür. Sistem, Etik Risk Skoru (ERS) hesaplayarak risk eşiklerini aştığında otomatik müdahale mekanizmalarını (yanıt geciktirme, insan operatöre yönlendirme, güvenli mod) tetikler.

4. ETVZ Entegrasyonunun Ontolojik Etkileri

4.1. Karar Mekanizmasında Paradigma Değişimi

Mevcut LLM’ler, RLHF (Reinforcement Learning from Human Feedback) ile eğitilmiş reaktif filtrelerdir (Ouyang et al., 2022). Bu yaklaşım, “zararlı” içeriği tespit etmekle sınırlıdır ve etik gerekçelendirme sunmaz. ETVZ, bu mekanizmanın yerine HVM’nin sağladığı çok boyutlu etik muhakemeyi yerleştirir.

Karşılaştırmalı Analiz:

ÖzellikStandart LLMETVZ-Entegre LLM
Karar Mekanizmasıİstatistiksel filtrelemeHesaplamalı etik muhakeme
GerekçelendirmeYok/SınırlıÇok boyutlu etik açıklama
AdaptasyonStatikDinamik, bağlam-duyarlı
ŞeffaflıkDüşükYüksek (epistemik izlenebilirlik)

4.2. Epistemolojik Dönüşüm: Halüsinasyondan Epistemik Alçakgönüllülüğe

Goldman’ın (1967) “tanıklık teorisi” (testimony theory) epistemolojisi, bilgi kaynaklarının güvenilirliğinin merkezi önemini vurgular. ETVZ’nin Epistemik Hafıza Sistemi, her bilgi iddiasını kaynak zincirine bağlayarak, LLM’lerin “bilmediğini bilme” (epistemic humility) kapasitesini artırır.

4.3. Kültürel Ontoloji: Evrenselcilikten Yerli Çoğulculuğa

Rawls’ın (1971) “örtüşen fikir birliği” (overlapping consensus) kavramından hareketle, ETVZ evrensel etik prensipler ile yerel değerler arasında dengeli bir sentez kurar. Bu, yapay zeka etiğindeki Batı-merkezli hegemonik söyleme (Coeckelbergh, 2020) alternatif bir çerçeve sunar.

4.4. Güvenlik Ontolojisi: Savunmasızlıktan Bilişsel Bağışıklığa

DERMS’in sağladığı gerçek zamanlı risk izleme, LLM’leri “prompt injection” (Perez & Ribeiro, 2022) ve “jailbreak” saldırılarına karşı dirençli hale getirir. Bu, sistemin pasif bir hedef olmaktan çıkıp aktif bir bağışıklık sistemine dönüşmesi anlamına gelir.

5. Uygulama Senaryoları ve Değerlendirme

5.1. Hukuki Danışmanlık Senaryosu

Problem: Standart LLM, güncel olmayan veya yanlış hukuki yorumlar üretebilir.

ETVZ Çözümü: Epistemik Hafıza Sistemi, Anayasa Mahkemesi kararları, yürürlükteki kanunlar ve emsal kararlar gibi yüksek güvenilirlikli kaynaklara öncelik verir. HVM, hukuki tavsiyenin deontik boyutunu (yasal uygunluk) vurgular.

5.2. Kültürlerarası İletişim Senaryosu

Problem: LLM, Batı-merkezli ton ve ifadeler kullanarak kültürel duyarsızlık gösterir.

ETVZ Çözümü: Kontekst Analizör, kullanıcının kültürel bağlamını tespit eder ve yanıtları yerel değerlere göre uyarlar (örn. yaşlı bakımı konusunda aile-merkezli yaklaşım).

5.3. Manipülasyon Direnci Senaryosu

Problem: Kullanıcı, duygusal manipülasyon veya tekrarlı isteklerle LLM’i zararlı içerik üretmeye zorlar.

ETVZ Çözümü: DERMS, anormal etkileşim örüntülerini tespit eder ve ERS eşiği aşıldığında güvenli moda geçer veya insan operatöre yönlendirir.

6. Eleştirel Değerlendirme ve Sınırlılıklar

6.1. Hesaplamalı Karmaşıklık

ETVZ’nin çok katmanlı mimarisi, standart LLM çıkarımına kıyasla önemli hesaplama yükü ekler. HVM’nin her çıktı için etik simülasyon yapması ve Epistemik Hafıza’nın graf sorgularını gerçekleştirmesi, gecikme (latency) artışına neden olabilir.

6.2. Değer Çoğulculuğu Paradoksu

Farklı kültürel bağlamlarda çatışan değerlerin olması durumunda, ETVZ’nin hangi değer sistemine öncelik vereceği sorusu belirsizliğini korumaktadır. Rawls’ın (1971) örtüşen fikir birliği kavramı teorik bir çözüm sunsa da, pratik uygulamada zorluklar mevcuttur.

6.3. Meta-Etik Temel Sorunu

HVM’nin etik hesaplamaları, normatif etik teorilere (deontoloji, sonuçsalcılık, erdem etiği) dayanmaktadır. Ancak bu teorilerin kendileri tartışmalıdır ve meta-etik seviyede bir temel eksikliği söz konusudur (Parfit, 2011).

7. Sonuç ve Gelecek Araştırma Yönelimleri

ETVZ projesi, mevcut LLM teknolojisini radikal bir yeniden tasarım yerine, modüler etik katmanlarla güçlendirmeyi önermektedir. Bu yaklaşım, yapay zeka sistemlerini “akıllı araçlar”dan “sorumlu aktörler”e dönüştürme potansiyeline sahiptir.

Gelecek araştırmalar şu yönlerde ilerleyebilir:

  1. Ampirik Validasyon: ETVZ bileşenlerinin gerçek dünya senaryolarında etkinliğinin ölçülmesi
  2. Kültürlerarası Karşılaştırma: Farklı kültürel bağlamlarda ETVZ performansının değerlendirilmesi
  3. Hesaplamalı Optimizasyon: HVM ve Epistemik Hafıza sistemlerinin gecikme ve kaynak kullanımının azaltılması
  4. Meta-Etik Temellendirme: ETVZ’nin normatif varsayımlarının daha derin felsefi incelemesi

ETVZ, yapay zeka etiği alanında Türkiye’nin teknoloji tüketicisi olmaktan çıkıp kural koyucu pozisyonuna geçmesini sağlayabilecek stratejik bir çerçeve sunmaktadır. Bu, küresel yapay zeka yönetişiminde çoğulcu ve kültürel olarak duyarlı bir alternatif temsil etmektedir.


Kaynakça

Aristoteles (M.Ö. 350). Nikomakhos’a Etik.

Bai, Y., et al. (2022). Constitutional AI: Harmlessness from AI Feedback. arXiv preprint.

Bender, E. M., & Koller, A. (2020). Climbing towards NLU: On meaning, form, and understanding in the age of data. ACL.

Bentham, J. (1789). An Introduction to the Principles of Morals and Legislation.

Brown, T. B., et al. (2020). Language models are few-shot learners. NeurIPS.

Coeckelbergh, M. (2020). AI Ethics. MIT Press.

Devlin, J., et al. (2019). BERT: Pre-training of deep bidirectional transformers for language understanding. NAACL.

Goldman, A. I. (1967). A causal theory of knowing. The Journal of Philosophy, 64(12).

Hofstede, G. (2001). Culture’s Consequences. Sage Publications.

Ji, Z., et al. (2023). Survey of hallucination in natural language generation. ACM Computing Surveys.

Kant, I. (1785). Groundwork of the Metaphysics of Morals.

Marcus, G., & Davis, E. (2020). GPT-3, Bloviator: OpenAI’s language generator has no idea what it’s talking about. MIT Technology Review.

Mill, J. S. (1863). Utilitarianism.

Ouyang, L., et al. (2022). Training language models to follow instructions with human feedback. NeurIPS.

Parfit, D. (2011). On What Matters. Oxford University Press.

Perez, F., & Ribeiro, I. (2022). Ignore previous prompt: Attack techniques for language models. arXiv preprint.

Rawls, J. (1971). A Theory of Justice. Harvard University Press.

Sorensen, T., et al. (2024). Value kaleidoscope: Engaging AI with pluralistic human values. AAAI.

Talat, Z., et al. (2021). All that’s ‘human’ is not gold: Evaluating human evaluation of generated text. ACL.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir