Haber Detayı
Anthropic'ten yapay zeka güvenliği için açık kaynaklı denetim aracı: Petri
Anthropic, büyük dil modellerinin davranışlarını analiz etmek ve potansiyel riskleri belirlemek için geliştirilen Petri (Parallel Exploration Tool for Risky Interactions) adlı yeni açık kaynak aracını duyurdu. Şirket, bu aracın yapay zekanın etik ve güvenli kullanımı için standart haline gelmesini hedefliyor. Petri, araştırmacıların hipotezlerini test etmesini kolaylaştırmak üzere tasarlandı. Sistem, hedef modele çoklu diyaloglar üzerinden çeşitli senaryolar uyguluyor…
Anthropic, büyük dil modellerinin davranışlarını analiz etmek ve potansiyel riskleri belirlemek için geliştirilen Petri (Parallel Exploration Tool for Risky Interactions) adlı yeni açık kaynak aracını duyurdu.
Şirket, bu aracın yapay zekanın etik ve güvenli kullanımı için standart haline gelmesini hedefliyor.
Petri, araştırmacıların hipotezlerini test etmesini kolaylaştırmak üzere tasarlandı.
Sistem, hedef modele çoklu diyaloglar üzerinden çeşitli senaryolar uyguluyor…