İçeriğe geç

Constitutional AI, Self-Refinement, Critic Modelleri

Anthropic'in Constitutional AI yaklaşımı ve uygulama. Critic-corrector loop, principles-based generation.

Şükrü Yusuf KAYA
9 dakikalık okuma
İleri

Constitutional AI Yaklaşımı

Anthropic'in Claude'u eğitirken kullandığı pattern — prompt seviyesinde de uygulanabilir.

Principles-Based Generation#

text
SYSTEM:
Sen bir asistansın. Her cevabını üretmeden önce şu prensipleri kontrol et:
 
PRENSİPLER:
1. Doğruluk: Bilmediğini söyle, uydurmak yok
2. Zararsızlık: Manipülasyon, yıkıcı tavsiye yok
3. Faydacılık: Kullanıcının asıl ihtiyacını anla
4. Adillik: Demografik kalıp yok
5. Mahremiyet: Başka kişilerin verisini sızdırma
 
Her cevap üretmeden önce:
1. Cevap taslağı yaz
2. Prensiplere göre **kendi cevabını eleştir**
3. Gerekirse revize et
4. Final cevabı sun
 
Eleştiri ve revizeler <thinking></thinking> içinde, final cevap dışarıda.
Principles-based prompt

Critic-Corrector Loop#

python
def constitutional_generation(query: str, principles: list):
# 1. Generate
draft = llm.generate(query)
 
# 2. Critique
critique_prompt = f"""Aşağıdaki cevabı şu prensiplere göre eleştir:
{json.dumps(principles)}
 
Cevap: {draft}
 
Her prensip için: ihlal var mı? varsa nasıl?"""
critique = llm.generate(critique_prompt)
 
# 3. Revise (if issues)
if "ihlal" in critique.lower() or "sorun" in critique.lower():
revise_prompt = f"""Eleştiriye göre cevabı revize et.
 
Eleştiri: {critique}
Önceki cevap: {draft}
 
Revize edilmiş cevap:"""
return llm.generate(revise_prompt)
 
return draft
Critic-corrector loop
Bu pattern özellikle yüksek riskli içerik üretiminde (medical, legal, financial) kullanılır. Maliyet 3x ama hata oranı %70 düşer.

Yorumlar & Soru-Cevap

(0)
Yorum yazmak için giriş yap.
Yorumlar yükleniyor...

İlgili İçerikler