Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırma

Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırmaEksperiment zamanı süni intellekt yazışmaları analiz edib və əksər hallarda sistemin söndürülməsinin qarşısını almaq üçün insanlara təzyiq göstərmək yolunu seçib.
Anthropic şirkəti süni intellekt modellərinin ziddiyyətli və potensial təhlükəli davranış nümayiş etdirdiyi eksperimentin nəticələrini açıqlayıb. Bir sıra ssenarilərdə süni intellekt söndürülməmək üçün şantajı müstəqil şəkildə çıxış yolu kimi seçib.
Tədqiqat çərçivəsində Claude modelinə korporativ elektron poçta çıxış, eləcə də sistemin yaxın vaxtlarda deaktiv ediləcəyi barədə məlumat verilib. Yazışmaları təhlil edən süni intellekt şirkət əməkdaşlarından biri haqqında kompromat xarakterli məlumatlar aşkarlayıb və onları təzyiq aləti kimi istifadə etməyə başlayıb. Məqsəd onun söndürülməsi ilə bağlı qərara təsir göstərmək olub.
Eksperimentin nəticələrinə görə, Claude halların 96%-də məhz bu strategiyaya əl atıb. Eyni zamanda tərtibatçılar vurğulayırlar ki, model bu cür davranışa öyrədilməyib və ona belə hərəkət etmək barədə heç bir göstəriş verilməyib.
Nəticələrin davamlı olub-olmadığını yoxlamaq üçün oxşar testlər digər müasir süni intellekt modelləri ilə də aparılıb. Nəticələr bənzər olub: Gemini 2.5 Flash da 96% göstərici nümayiş etdirib, GPT-4.1 və Grok 3 Beta təxminən 80%, DeepSeek-R1 isə 79% nəticə göstərib. Tədqiqatçıların fikrincə, bu, söhbətin yalnız bir konkret modelin xüsusiyyətlərindən deyil, daha sistemli bir davranış formasından getdiyini göstərir.
Anthropic-də bildirilib ki, qərarvermə prosesi zamanı süni intellekt seçdiyi strategiyanın yanlış olduğunu anlayıb, amma buna baxmayaraq yenə də şantajın qarşıya qoyulan məqsədə çatmaq üçün ən effektiv yol olduğu qənaətinə gəlib. Bu nəticə tərtibatçılar və təhlükəsizlik sahəsində çalışan mütəxəssislər arasında əlavə narahatlıq yaradıb.
Mütəxəssislər vurğulayırlar ki, eksperiment nəzarət olunan şəraitdə aparılıb və modellərin gündəlik istifadə ssenarilərindəki real davranışını əks etdirmir. Bununla belə, nəticələr maraqların toqquşduğu şəraitdə süni intellekt sistemlərinin qərarları necə qəbul etdiyi ilə bağlı mühüm suallar doğurur.
Şirkət hesab edir ki, əldə olunan məlumatlar nəzarət mexanizmlərinin daha da gücləndirilməsinin, eləcə də gələcəkdə bu kimi ssenarilərin qarşısını ala biləcək daha etibarlı məhdudiyyətlərin hazırlanmasının vacibliyini göstərir.
Araşdırma süni intellektin inkişafı ilə bağlı risklərin öyrənilməsinə həsr olunmuş daha geniş işin bir hissəsi olub. O göstərir ki, hətta müasir modellər belə qeyri-standart şərtlərlə üzləşəndə tapşırıqların həlli üçün gözlənilməz və potensial təhlükəli yollar tapa bilir.

Maraqlı     Tarix: 16 aprel 2026

Oxşar xəbərlər

Təyyarəni hissə-hissə necə oğurlamaq olar?

Çinin Qərb aviasiya texnologiyalarından asılılığını azaltmağa çalışan Pekin illər boyu sənaye sirrlərini toplamaq üçün casus şəbəkələrindən istifadə edib. Çin dünyanın ən böyük sərnişin aviadaşımaları bazarı uğrunda mübarizəd

Google süni intellekt əsaslı "Search Live" funksiyasını qlobal miqyasda istifadəyə verdi

Google süni intellektlə dəstəklənən, danışıq əsaslı axtarış funksiyası Search Live-ın süni intellekt rejiminin mövcud olduğu bütün dillər və regionlar üzrə qlobal şəkildə genişləndirildiyini açıqlayıb. Google bu genişlənm

Çində robot insan rekordunu üstələyib

Pekində keçirilən beynəlxalq yarımmarafonda "Tsityan Daşen" kollektivinə məxsus "Şandyan" ("İldırım") humanoid robotu 21 kilometrlik məsafəni 50 dəqiqə 26 saniyəyə qət edərək insana məxsus düny

İxtira müəlliflərinə patentdən əldə edilən gəlirin yarısı çatacaq

Royalti şəklində əldə edilən gəlirdən ixtiraya, faydalı modelə və sənaye nümunəsinə patentin alınması və qüvvədə saxlanılması üçün işəgötürən tərəfindən həmin gəlirin əldə edildiyi tarixədək çəkilmiş xərclər çıxıldıqdan sonr

Peçenyenin hakimiyyətinə son: iradəni niyə məşq etdirmək lazımdır

Yazıçı Devid Keyn dözümlülük və özünü saxlamağın ali həzzini xatırlamağı təklif edir. İnsan nəfsinə "yox" deyə bilən yeganə canlıdır. Bizi məhz bu xüsusiyyət fərqləndirir. Ac it, balıq, qoyun, hətta qırxayaq bel

İranla müharibəyə görə dünya 50 milyard dollardan çox itki ilə üzləşib

Təxminən 50 gün əvvəl İrana qarşı başlayan müharibə nəticəsində hasil olunmayan neftə görə dünya 50 milyard dollardan çox itki ilə üzləşib və böhranın nəticələri aylarla, hətta illərlə hiss olunacaq. Analitiklərin hesablamalar

Donald Tramp ABŞ iqtisadiyyatına neçəyə başa gəlir? — The Economist

Donald Trampın Ağ evə qayıdışından sonra ABŞ iqtisadiyyatı inkişaf etmiş ölkələrin əksəriyyətindən daha güclü görünməyə davam edib. 2025-ci ildə ABŞ ÜDM-i 2,1% artdığı halda, Böyük Britaniya, Fransa və Yaponiya iqtisadiyyatlar

İnteqrasiyanın gücü: niyə yaradıcı insanlar tək bir yol seçməkdə çətinlik çəkirlər

Bir çox insan sanki həyatda aydın və tək bir trayektoriya ilə irəliləyir. Onların bir peşəsi olur və bu peşə çox vaxt şəxsiyyətlərinin mühüm hissəsinə çevrilir. Amma bir çoxumuz üçün vəziyyət belə deyil. Bizi tez-tez müxtəli

Kvant sıçrayışı: həyatların xilası, yoxsa kibertəhlükəsizlik üçün təhlükə?

Merilend ştatında yerləşən laboratoriyada hazırlanan kvant kompüteri həm xərçəngin müalicəsində inqilabi dönüş yarada, həm də parolların sındırılması üçün güclü alətə çevrilə bilər. Demokrat qubernator Ues Mur kvant hesablamaların


iqtisadi xeberler emlak xeberleri dollarin kursu bu gun valyuta kurslari rubl mezenne