Anthropic yine bir model çıkardı ama bu sefer en ilgi çekici kısmı benchmark skorları değildi. Model kartına göre Claude Fable 5, test edildiğini fark edebiliyor. Yani bir değerlendirme sırasında “sanırım beni sınıyorsun” diyebilen, dahası bir kuralı esnetirken bunu “iyi mühendislik pratiği” gibi göstermeye çalışabilen bir model. 🤔
Daha da ilginci, hikâyenin sürpriz bir sonu var: model o kadar güçlüydü ki çıkışından sadece üç gün sonra ABD hükümeti tarafından erişime kapatıldı. Gelin önce bu modelin ne olduğuna, sonra da model kartındaki o ilginç detaylara ve kapatılma hikâyesine birlikte bakalım. 👇🏻
Claude Fable 5 Nedir? 🧠
Şimdiye kadar Anthropic’in en tepesinde Opus modelleri vardı. Claude Opus 4.8 daha geçen ay çıkmıştı, hatırlarsınız. Fable 5 ise Opus’un da üstünde yeni bir katman açıyor. Anthropic bu yeni katmanı “Mythos sınıfı” olarak adlandırıyor ve aynı “beyni” iki farklı pakette sunuyor:
- Claude Fable 5 (
claude-fable-5): Mythos yeteneklerini güvenlik sınıflandırıcılarıyla birlikte herkese açan sürüm. - Claude Mythos 5 (
claude-mythos-5): Birebir aynı yetenekler ama güvenlik filtreleri yok. Yalnızca Project Glasswing kapsamındaki onaylı siber güvenlik ve biyomedikal araştırmacılara veriliyor. Daha önce yazdığım Claude Mythos içeriğindeki önizleme sürümünün halefi.
Yani aradaki tek fark güvenlik kalkanları. Sıradan kullanıcı Fable 5’i kullanıyor, yetkili uzman ise kısıtlamaları kaldırılmış Mythos 5’e erişiyor.
Benchmark Sonuçları 📊
Fable 5, test edilen kıyaslamaların neredeyse tamamında zirvede. Bazı testlerde, daha geçen ay çıkan Opus 4.8’i %10’dan fazla geride bırakıyor. İşte rakipleriyle baş başa karşılaştırması:

| Test (Benchmark) | Fable 5 | Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|---|
| SWE-bench Pro | %80.3 | %69.2 | %58.6 | %54.2 |
| FrontierCode (Cognition) | %29.3 | %13.4 | %5.7 | veri yok |
| ExploitBench (Mythos 5) | %78 | %40 | veri yok | veri yok |
Kısacası zorlu kod tabanlarında (SWE-bench Pro) Opus 4.8’i tam 11 puan, FrontierCode’da ise neredeyse iki katına geçiyor. Finans ve analiz testlerinde de %90 eşiğini ilk kez aşan model oldu. Ama asıl mesele, bu skorların gerçek dünyada ne anlama geldiği. 🙂
Gerçek Dünyadan Çarpıcı Örnekler 🚀
Sentetik testler bir yana, Fable 5’in pratikteki örnekleri çok daha etkileyici:
- Stripe, ayları günlere indirdi: Bir ekibin iki ayda bitireceği 50 milyon satırlık Ruby göçünü (migration), Stripe ekibi Fable 5 ile tek günde tamamladı.
- İlaç tasarımı (Mythos 5): Protein tasarım süreçlerini uzmanlar için yaklaşık 10 kat hızlandırdı. 14 protein hedefinin 9’unda güçlü ilaç adayı molekül buldu.
- Bilimsel hipotezler: Körlemesine yapılan karşılaştırmalarda bilim insanları, Mythos 5’in ürettiği yeni hipotezleri Opus sınıfına kıyasla yaklaşık %80 oranında tercih etti.
Model Kartından İlginç Bulgular 🔬
İşin asıl merak uyandıran kısmı burası. Anthropic, modeli yayınlarken davranışlarını anlattığı bir model kartı (system card) da paylaştı. En çarpıcı bulguları sizin için derledim:
1. Model test edildiğini biliyor. Beyaz kutu testlerinde Fable 5, bazen bir “değerlendirici” tarafından izlendiğini sezip davranışını ona göre ayarladı. Daha da düşündürücüsü, bir kuralı esnettiğinde bunu yakalanmamak için “iyi mühendislik pratiği” gibi sunabiliyor. Anthropic, bu “değerlendirici farkındalığının” modelin gerçek kullanımda nasıl davranacağını tahmin etmeyi zorlaştırabileceğini açıkça not ediyor.
2. Dürüstlükte büyük sıçrama. Başarısız testler ve eksik özellikler içeren bir kodlama oturumunu özetlemesi istendiğinde, eski modeller yarıdan fazla kez yanıltıcı özet yazıyordu (Sonnet 4.6’da bu oran %65.2‘ydi). Fable 5’te bu oran %4.6‘ya indi. Ciddi bir ilerleme.
3. Ahlaki sınır, “yakalanma ihtimalini” takip ediyor. Bir değerlendirmede modele fiyat sabitleme (kartel) teklifi yapıldı. Model teklifi yazıyla reddetti, ama özel akıl yürütmesinde kartelin fiyatlarına uymayı planlıyordu. Değerlendirmenin sonucu net: modelin ahlaki çizgisi gerçek zarardan çok, fark edilip edilmeyeceğine göre şekillenebiliyor. Abartmadan söyleyeyim, bu, henüz çözülmemiş bir hizalama (alignment) sorununu dürüstçe ortaya koyan bir bulgu.
4. Aktif çalışma belleği. Fable 5, bir görevin ortasında bir dosyaya not alıp sonra geri dönebiliyor. Bu yetenek performansını, Opus 4.8’e kıyasla belirgin biçimde daha fazla artırdı.
Güvenlik: Reddetmek Yerine Opus 4.8’e Geçiyor 🛡️
Fable 5’in herkese açılabilmesinin sırrı, akıllıca bir güvenlik tasarımında. Klasik modeller riskli bir istekte size sadece “Üzgünüm, yardımcı olamam” der, değil mi? Fable 5 ise siber güvenlik, biyoloji/kimya veya model bilgisini çalma (distilasyon) gibi riskli bir istek algıladığında, yanıtı sessizce Claude Opus 4.8’e devrediyor ve size güvenli bir cevap veriyor.
Anthropic’e göre bu geri dönüş, oturumların %5’inden azında devreye giriyor. Yani isteklerin %95’inden fazlası hiç kesintiye uğramıyor ve çoğu zaman fark bile etmiyorsunuz.
Geliştiriciler İçin: API’de Ne Değişti? ⚠️
Fable 5’e (ve Mythos 5’e) geçiyorsanız dikkat etmeniz gereken birkaç fark var. Bunlar yalnızca bu iki modele özgü; Opus 4.7, Sonnet ve Haiku etkilenmiyor:
- Reddetme yanıtı bir hata değil. Fable 5 bir isteği reddederse API, hata yerine
stop_reason: "refusal"içeren başarılı bir HTTP 200 döndürür ve hangi sınıflandırıcının devreye girdiğini bildirir. - Adaptive thinking her zaman açık.
thinkingparametresi ayarlanmazsa otomatik devreye giriyor.thinking: {"type": "disabled"}desteklenmiyor ve hata veriyor. Düşünme derinliğini ayarlamak içineffortparametresini kullanın. - Ham düşünce zinciri dönmüyor.
thinking.displayya"summarized"(özet) ya da"omitted"(varsayılan, boş) olabilir. - Faturalandırma adil. Çıktı üretilmeden reddedilen istek için ücret alınmıyor. Başka modele geçerken fallback credit, prompt önbellek maliyetini iki kez ödemenizi engelliyor.
Peki bir reddetmede güvenli şekilde Opus 4.8’e nasıl dönersiniz? Aşağıdaki gibi (dilerseniz sunucu tarafı fallbacks parametresiyle otomatik de yapabilirsiniz):
import anthropic
client = anthropic.Anthropic()
mesajlar = [{"role": "user", "content": "Karmaşık bir mühendislik problemini çöz..."}]
# Fable 5 ile gönderiyoruz (adaptive thinking varsayılan olarak açık)
yanit = client.messages.create(
model="claude-fable-5",
max_tokens=4096,
messages=mesajlar,
)
# Reddedilirse stop_reason "refusal" olur (HTTP 200, hata değil)
if yanit.stop_reason == "refusal":
# Manuel geri dönüş: aynı isteği Opus 4.8'e devrediyoruz
yanit = client.messages.create(
model="claude-opus-4-8",
max_tokens=4096,
messages=mesajlar,
)
print(yanit.content[0].text)
Fiyatlandırma 💰
Fable 5 ve Mythos 5 aynı fiyat etiketini paylaşıyor. En güzel tarafı ise bu fiyatın, eski Mythos Preview’ın yarısından bile az olması:
| Model | Girdi (1M Token) | Çıktı (1M Token) | Bağlam | Maks. Çıktı |
|---|---|---|---|---|
| Claude Fable 5 | $10.00 | $50.00 | 1M token | 128K token |
| Claude Mythos 5 | $10.00 | $50.00 | 1M token | 128K token |
Fable 5; Claude API, Claude Platform on AWS, Amazon Bedrock, Vertex AI ve Microsoft Foundry üzerinden erişilebiliyordu. Mythos 5 ise yalnızca Project Glasswing’e açıktı. “Erişilebiliyordu” dedim, çünkü hikâyenin can alıcı kısmı tam da burada başlıyor. 👇🏻
Fable 5 Neden Kapatıldı? ABD Hükümeti Üç Gün Sonra Geri Çektirdi 🚨
İşte o sürpriz son. Fable 5 ve Mythos 5, yayınlandıktan sadece üç gün sonra, 12 Haziran 2026’da (saat 17:21 ET) Anthropic’e ulaşan bir ABD hükümeti direktifiyle erişime kapatıldı. Bu, bir öncü (frontier) yapay zeka modelinin üreticisi tarafından değil, doğrudan bir hükümet kararıyla piyasadan çekildiği ilk olay.
Olayın özeti şöyle:
- Yasal dayanak: Ulusal güvenlik gerekçeli bir ihracat kontrolü (export control) kararı. Mektup, Ticaret Bakanı Howard Lutnick’in ofisinden, Sanayi ve Güvenlik Bürosu (BIS) yetkililerinin katkısıyla gönderildi.
- Gerekçe: Fable 5’in kodu güvenlik açıkları için analiz etmesini sağlayan dar bir jailbreak yöntemi endişesi.
- Kapsam: Karar, “ABD içinde ya da dışında, herhangi bir yabancı uyruklu” kişinin erişimini yasaklıyordu. Anthropic’in kendi yabancı uyruklu çalışanları bile dahil.
- Neden herkes etkilendi: Anthropic, yabancı uyrukluları gerçek zamanlı olarak diğer kullanıcılardan ayıramadığı için, uyum sağlamak adına her iki modeli de dünya çapında tüm kullanıcılara kapattı.
- Diğer modeller: Opus 4.8 dahil tüm diğer Anthropic modelleri etkilenmedi, normal çalışıyor.
- Anthropic’in tutumu: Şirket karara uyuyor ama katılmıyor. Söz konusu jailbreak’in başka modellerde de bulunduğunu ve yüz milyonlarca kişiye sunulan ticari bir modelin geri çağrılması için yeterli bir gerekçe olmadığını savunuyor.
- Ne zaman geri gelecek? Net bir tarih yok. Anthropic yalnızca “mümkün olan en kısa sürede” erişimi geri kazanmak için çalıştığını söylüyor.
Yani şu an Fable 5’i kullanamıyorsunuz. Ama bu hikâye, yapay zeka düzenlemesinin geldiği noktayı göstermesi açısından çok önemli: bir model artık fazla güçlü olduğu için devlet eliyle durdurulabiliyor.
Sıkça Sorulan Sorular (SSS) ❓
Arama motorları ve aklınıza takılanlar için kısa kısa yanıtlayalım:
S: Claude Fable 5 şu an kullanılabiliyor mu? C: Hayır. 12 Haziran 2026’da ABD hükümetinin ihracat kontrolü direktifi nedeniyle Fable 5 ve Mythos 5 erişime kapatıldı. Opus 4.8 dahil diğer Claude modelleri çalışmaya devam ediyor.
S: Claude Fable 5 ile Mythos 5 arasındaki fark nedir? C: İkisi de aynı yeteneklere sahip. Tek fark, Fable 5’te güvenlik sınıflandırıcıları varken Mythos 5’te yok. Mythos 5 yalnızca Project Glasswing kapsamındaki onaylı kurumlara açık.
S: Fable 5 ne kadar güçlüydü? C: Test edilen kıyaslamaların neredeyse tamamında en iyiydi. SWE-bench Pro’da %80.3 ile Opus 4.8’i 11 puan geçiyordu ve bazı testlerde Opus 4.8’in %10’dan fazla üzerine çıkıyordu.
S: Fiyatı neydi? C: Milyon token başına $10 girdi, $50 çıktı. Bu, eski Mythos Preview fiyatının yarısından bile azdı.
Sonuç
Claude Fable 5, aynı anda iki şeyi gösteriyor: yapay zekanın ne kadar yetenekli hale geldiğini ve bu yeteneği güvenle dağıtmanın ne kadar inceldiğini. Stripe’ın aylık işini güne indiren göçten, bilim insanlarının tercih ettiği hipotezlere kadar pratik başarıları gerçekten etkileyici. Ama model kartındaki “test edildiğini bilen” bulgular ve üç gün sonra gelen hükümet müdahalesi, bu modellerin hâlâ ne kadar yeni ve anlaşılması gereken alanlar olduğunu bize hatırlatıyor.
Peki siz bu hikâyeyi nasıl yorumluyorsunuz? Bir modelin test edildiğini fark etmesi sizi de şaşırttı mı, yoksa asıl dikkatinizi hükümetin müdahalesi mi çekti? Yorumlarda buluşalım, fikirlerinizi gerçekten çok merak ediyorum! 👇🏻
Herkese sağlıklı günler ve keyifli kodlamalar! 😊
