Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırma

Süni intellekt öz xeyri üçün şantaj edə bilir — araşdırmaEksperiment zamanı süni intellekt yazışmaları analiz edib və əksər hallarda sistemin söndürülməsinin qarşısını almaq üçün insanlara təzyiq göstərmək yolunu seçib.
Anthropic şirkəti süni intellekt modellərinin ziddiyyətli və potensial təhlükəli davranış nümayiş etdirdiyi eksperimentin nəticələrini açıqlayıb. Bir sıra ssenarilərdə süni intellekt söndürülməmək üçün şantajı müstəqil şəkildə çıxış yolu kimi seçib.
Tədqiqat çərçivəsində Claude modelinə korporativ elektron poçta çıxış, eləcə də sistemin yaxın vaxtlarda deaktiv ediləcəyi barədə məlumat verilib. Yazışmaları təhlil edən süni intellekt şirkət əməkdaşlarından biri haqqında kompromat xarakterli məlumatlar aşkarlayıb və onları təzyiq aləti kimi istifadə etməyə başlayıb. Məqsəd onun söndürülməsi ilə bağlı qərara təsir göstərmək olub.
Eksperimentin nəticələrinə görə, Claude halların 96%-də məhz bu strategiyaya əl atıb. Eyni zamanda tərtibatçılar vurğulayırlar ki, model bu cür davranışa öyrədilməyib və ona belə hərəkət etmək barədə heç bir göstəriş verilməyib.
Nəticələrin davamlı olub-olmadığını yoxlamaq üçün oxşar testlər digər müasir süni intellekt modelləri ilə də aparılıb. Nəticələr bənzər olub: Gemini 2.5 Flash da 96% göstərici nümayiş etdirib, GPT-4.1 və Grok 3 Beta təxminən 80%, DeepSeek-R1 isə 79% nəticə göstərib. Tədqiqatçıların fikrincə, bu, söhbətin yalnız bir konkret modelin xüsusiyyətlərindən deyil, daha sistemli bir davranış formasından getdiyini göstərir.
Anthropic-də bildirilib ki, qərarvermə prosesi zamanı süni intellekt seçdiyi strategiyanın yanlış olduğunu anlayıb, amma buna baxmayaraq yenə də şantajın qarşıya qoyulan məqsədə çatmaq üçün ən effektiv yol olduğu qənaətinə gəlib. Bu nəticə tərtibatçılar və təhlükəsizlik sahəsində çalışan mütəxəssislər arasında əlavə narahatlıq yaradıb.
Mütəxəssislər vurğulayırlar ki, eksperiment nəzarət olunan şəraitdə aparılıb və modellərin gündəlik istifadə ssenarilərindəki real davranışını əks etdirmir. Bununla belə, nəticələr maraqların toqquşduğu şəraitdə süni intellekt sistemlərinin qərarları necə qəbul etdiyi ilə bağlı mühüm suallar doğurur.
Şirkət hesab edir ki, əldə olunan məlumatlar nəzarət mexanizmlərinin daha da gücləndirilməsinin, eləcə də gələcəkdə bu kimi ssenarilərin qarşısını ala biləcək daha etibarlı məhdudiyyətlərin hazırlanmasının vacibliyini göstərir.
Araşdırma süni intellektin inkişafı ilə bağlı risklərin öyrənilməsinə həsr olunmuş daha geniş işin bir hissəsi olub. O göstərir ki, hətta müasir modellər belə qeyri-standart şərtlərlə üzləşəndə tapşırıqların həlli üçün gözlənilməz və potensial təhlükəli yollar tapa bilir.

Maraqlı     Tarix: 16 aprel 2026

Oxşar xəbərlər

Qarabağ Universitetinin Biznes və iqtisadiyyat fakültəsinin binasının açılışı oldu

Azərbaycan Respublikasının Prezidenti İlham Əliyev dekabrın 23-də Xankəndi şəhərində Qarabağ Universitetinin Biznes və iqtisadiyyat fakültəsinin yeni inşa olunmuş binasının açılışında iştirak edib. Marja xəbər verir ki, dövlətimizi

Dünya iqtisadiyyatı gözlədiyimizdən daha dayanıqlı olub

Trampın tarifləri bir çoxlarının gözlədiyi kimi güclü qarşılıqlı reaksiyaya səbəb olmadı. 2025-ci il qlobal ticarətin dağılması ili olmadı. Lakin ticarət dəyişdi — mürəkkəb və qeyri-bərabər şəkildə:. bəzi dəyişikliklər müvəqqətidi

1977-ci ildə kosmosa göndərilən aparat yarım əsrdir yol gedir, 1 işıq günü uzaqlığa çatacaq - 26 milyard kilometr

NASA-nın dərin kosmos tədqiqatları üçün 1977-ci ildə kosmosa göndərdiyi Voyager 1, təxminən yarım əsr sonra yeni bir mərhələyə yaxınlaşır. Marja xəbər verir ki, kosmik aparat 2026-cı ilin noyabrında Dünyadan bir "işı

İnteqrasiyanın gücü: niyə yaradıcı insanlar tək bir yol seçməkdə çətinlik çəkirlər

Bir çox insan sanki həyatda aydın və tək bir trayektoriya ilə irəliləyir. Onların bir peşəsi olur və bu peşə çox vaxt şəxsiyyətlərinin mühüm hissəsinə çevrilir. Amma bir çoxumuz üçün vəziyyət belə deyil. Bizi tez-tez müxtəli

Qlobal iqtisadiyyat rüsumlara uyğunlaşır

2026-cı ildə qlobal ÜDM artımı bir qədər zəifləyəcək. BMT-nin Ticarət və İnkişaf Konfransı (UNCTAD) ekspertlərinin proqnozuna görə, dünya iqtisadiyyatı 2026-cı ildə 2025-ci ildəki 2,8%-dən sonra 2,7% artacaq. Artımın zəifləməsin

Risk, yoxsa xilas yolu? Ford bütün ümidini batareya istehsalına bağlayır

Uzun illər avtomobil və pikap istehsalı ilə məşğul olan Ford Motor indi iriölçülü akkumulyatorların istehsalına başlamağı planlaşdırır. Bu batareyalar enerji şirkətləri, məlumat mərkəzləri, biznes strukturları və fərdi e

İxtira müəlliflərinə patentdən əldə edilən gəlirin yarısı çatacaq

Royalti şəklində əldə edilən gəlirdən ixtiraya, faydalı modelə və sənaye nümunəsinə patentin alınması və qüvvədə saxlanılması üçün işəgötürən tərəfindən həmin gəlirin əldə edildiyi tarixədək çəkilmiş xərclər çıxıldıqdan sonr

2025-ci ildə hansı iqtisadiyyat daha yaxşı nəticə göstərib?

"The Economist jurnalının illik reytinqi. Daha pis ola bilərdi. Aprel ayında prezident Donald Tramp ticarət müharibəsinə başlayanda, investorlar və bir çox iqtisadçılar dərin qlobal geriləmədən qorxurdular. Nəticəd

Müharibənin genişlənməsi fonunda enerji və maliyyə bazarında böhran daha da dərinləşə bilər

ABŞ prezidenti Donald Tramp və İran münaqişəni daha da genişləndirmək hədələri səsləndirərək Körfəz bölgəsində enerji və yanacaq obyektlərini hədəf ala biləcəklərini bildiriblər. Reuters yazır ki, bu məsələ qlobal enerj


iqtisadi xeberler dollar kursu bitkoin valyuta mezennesi en son xeberler