Claude Opus

Opus 4.7 ile deneyimlediklerim:

Yeni Opus’dan 4.6 ile yaptirdigim karmasik bir veri senkronizyon implementasyonunu analiz etmesini ve aciklarini bulmasini istedim. Yirmiye yakin madde iceren bir liste olusturdu. Bunlardan dört tanesi cok kritik. Özellilkle bunlardan ilki bir güvenlik sorunu.

Bu hatalarin critical ve high olanlarini ortadan kaldirmasini istedim. Sekiz saat süren bir calisma sonunda mevcut implementasyonu da calismaz hale getiren bir sonuc ortaya cikardi, calisan seylerde calismaz oldu.

Bu noktada Opus 4.6 birkac iterasyon ile yaptigi ya da buldugu hatalari düzeltebiliyorken, Opus 4.7 halüsinasyon sebepli gereksiz, hatali ve anlamsiz analizler sonunda implementasyonu daha da kötülestirdi.

Opus 4.7 cok iyi analiz yapabiliyor, lakin önerilerini karmasik mimari ve yapidaki bir kod tabaninda implementasyon ile taclandirmakta cok zorlaniyor. Burada islemci gereksinimini minimize edebilmek icin context kapasitesi üzerinde degisiklige gidilmis gibi duruyor. Bu yüzden Opus 4.7 benim güvenimi yitirdi.

Bundan böyle ben implementasyonu Opus 4.6 ile yapmaya devam edecegim. Akabinde Opus 4.7 ile mevcut aciklari analiz ettirip, bunlarin yine Opus 4.6 tarafindan islenmesini saglayacagim.

Opus 4.7 Opus Mythos’un temelini olusturuyor büyük bir ihtimalle, cünkü critik güvenlik sorunlarini bulmakta cok yetkin.