Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırma

Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırmaEksperiment zamanı süni intellekt yazışmaları analiz edib və əksər hallarda sistemin söndürülməsinin qarşısını almaq üçün insanlara təzyiq göstərmək yolunu seçib.
Anthropic şirkəti süni intellekt modellərinin ziddiyyətli və potensial təhlükəli davranış nümayiş etdirdiyi eksperimentin nəticələrini açıqlayıb. Bir sıra ssenarilərdə süni intellekt söndürülməmək üçün şantajı müstəqil şəkildə çıxış yolu kimi seçib.
Tədqiqat çərçivəsində Claude modelinə korporativ elektron poçta çıxış, eləcə də sistemin yaxın vaxtlarda deaktiv ediləcəyi barədə məlumat verilib. Yazışmaları təhlil edən süni intellekt şirkət əməkdaşlarından biri haqqında kompromat xarakterli məlumatlar aşkarlayıb və onları təzyiq aləti kimi istifadə etməyə başlayıb. Məqsəd onun söndürülməsi ilə bağlı qərara təsir göstərmək olub.
Eksperimentin nəticələrinə görə, Claude halların 96%-də məhz bu strategiyaya əl atıb. Eyni zamanda tərtibatçılar vurğulayırlar ki, model bu cür davranışa öyrədilməyib və ona belə hərəkət etmək barədə heç bir göstəriş verilməyib.
Nəticələrin davamlı olub-olmadığını yoxlamaq üçün oxşar testlər digər müasir süni intellekt modelləri ilə də aparılıb. Nəticələr bənzər olub: Gemini 2.5 Flash da 96% göstərici nümayiş etdirib, GPT-4.1 və Grok 3 Beta təxminən 80%, DeepSeek-R1 isə 79% nəticə göstərib. Tədqiqatçıların fikrincə, bu, söhbətin yalnız bir konkret modelin xüsusiyyətlərindən deyil, daha sistemli bir davranış formasından getdiyini göstərir.
Anthropic-də bildirilib ki, qərarvermə prosesi zamanı süni intellekt seçdiyi strategiyanın yanlış olduğunu anlayıb, amma buna baxmayaraq yenə də şantajın qarşıya qoyulan məqsədə çatmaq üçün ən effektiv yol olduğu qənaətinə gəlib. Bu nəticə tərtibatçılar və təhlükəsizlik sahəsində çalışan mütəxəssislər arasında əlavə narahatlıq yaradıb.
Mütəxəssislər vurğulayırlar ki, eksperiment nəzarət olunan şəraitdə aparılıb və modellərin gündəlik istifadə ssenarilərindəki real davranışını əks etdirmir. Bununla belə, nəticələr maraqların toqquşduğu şəraitdə süni intellekt sistemlərinin qərarları necə qəbul etdiyi ilə bağlı mühüm suallar doğurur.
Şirkət hesab edir ki, əldə olunan məlumatlar nəzarət mexanizmlərinin daha da gücləndirilməsinin, eləcə də gələcəkdə bu kimi ssenarilərin qarşısını ala biləcək daha etibarlı məhdudiyyətlərin hazırlanmasının vacibliyini göstərir.
Araşdırma süni intellektin inkişafı ilə bağlı risklərin öyrənilməsinə həsr olunmuş daha geniş işin bir hissəsi olub. O göstərir ki, hətta müasir modellər belə qeyri-standart şərtlərlə üzləşəndə tapşırıqların həlli üçün gözlənilməz və potensial təhlükəli yollar tapa bilir.

Maraqlı     Tarix: 16 aprel 2026

Oxşar xəbərlər

Dünya iqtisadiyyatı gözlədiyimizdən daha dayanıqlı olub

Trampın tarifləri bir çoxlarının gözlədiyi kimi güclü qarşılıqlı reaksiyaya səbəb olmadı. 2025-ci il qlobal ticarətin dağılması ili olmadı. Lakin ticarət dəyişdi — mürəkkəb və qeyri-bərabər şəkildə:. bəzi dəyişikliklər müvəqqətidi

Araşdırma göstərir: ChatGPT daha sürətli öyrənməyə kömək edə bilər — lakin bir "amma" var

Yeni araşdırmaya görə, süni intellekt çat-botları "kognitiv qoltuq ağacı" rolunu oynayaraq məlumatın yadda qalmasını zəiflədə bilər. Tədqiqat Rio-de-Janeyro Federal Universitetinin süni intellekt üzrə eksperti Andr

Robotdan daha yaxşı olun: süni intellekt dövründə necə öyrənməliyik?

Yeni vəzifə — tələbələri düşünməyi inkişaf etdirməyə söykənən öyrənməyə yönəltməkdir, bunu müəllim Kristi Girdharri hesab edir. Mən ali təhsildə generativ süni intellekt dalğasını çox tez tutdum: yazı bacarıqlarını tədri

Təyyarəni hissə-hissə necə oğurlamaq olar?

Çinin Qərb aviasiya texnologiyalarından asılılığını azaltmağa çalışan Pekin illər boyu sənaye sirrlərini toplamaq üçün casus şəbəkələrindən istifadə edib. Çin dünyanın ən böyük sərnişin aviadaşımaları bazarı uğrunda mübarizəd

Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırma

Eksperiment zamanı süni intellekt yazışmaları analiz edib və əksər hallarda sistemin söndürülməsinin qarşısını almaq üçün insanlara təzyiq göstərmək yolunu seçib. Anthropic şirkəti süni intellekt modellərinin ziddiyyətl

Aydınlıq illüziyası: həqiqətən nəyisə anlayıb-anlamadığını necə yoxlamaq olar

Ness Labs-ın qurucusu Enn-Lora Le Kanf öz biliklərimizlə bağlı təsəvvürlərə meydan oxumağı təklif edir. Məndən Ness Labs-ı niyə yaratdığımı soruşanda həmişə etiraf edirəm ki, başlanğıcda bunun arxasında bir qədər eqoist səbəblə

Bezos Mask-a qarşı: milyarderlərin Ay uğrunda yeni savaşı

İlon Mask diqqətini Marsdan Ay bazasına yönəldib və indi Ceff Bezosla rəqabətdə açıq qarşıdurmaya gedir. Mask və Bezos arasında rəqabət daha da kəskinləşir — hər iki milyarder artıq birbaşa Ay uğrunda mübarizə aparır. İllərl

Görüləcək işlər borc deyil, töhfədir: işlərin öhdəsindən gəlməyin zərif yolu

Görüləcək işlər siyahısı seçim edə biləcəyiniz menyudur, davranış elmləri üzrə mütəxəssis Denni Kenni deyir. Bazar günü axşamdır. Qarşıdakı həftə üçün görüləcək işlər siyahıma baxıram və tanış ağırlıq hissi sinəmə çökür

BCG və Kaliforniya Universitetinin yeni hesabatı: işdə süni intellektdən daimi istifadə zehni yorğunluq və "yanma sindromu" yaradır

Boston Consulting Group konsaltinq şirkəti və Kaliforniya Universitetinin birgə apardığı yeni araşdırma narahatedici tendensiyanı ortaya çıxarıb: məhsuldarlığı artırmaq məqsədilə süni intellektdən aktiv istifadə əməkdaşları


iqtisadi xeberler telefonla pul qazanmaq kicik biznes biznes krediti dollar məzənnəsi