Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции
 
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.
Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.
В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.
Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.
Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.
Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?
Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.
Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини от Варна, региона и света |
 |
 НАП-Варна проверили 11 големи обекта за търговия с храни
Петък, 21 Февруари 2025 17:39
Служителите от „Фискален контрол“ на НАП проверяват по-големите борси, тържища и хранителни магазини в цялата страна. Контролните действия са част от правителствените мерки за скъсяване на веригата на...
| |
 |
 ПП-ДБ обявиха още две свои имена за КЗК и КЕВР
Петък, 21 Февруари 2025 17:24
След като вчера обяви номинацията на доц. д-р Иван Стойнев за председател на Комисията за защита на конкуренцията (КЗК) днес от ПП-ДБ с прессъобщение обявяват още две свои имена за регулаторите - д-р Юлиян...
| |
 |
 Здравното министерство призна за недостиг на онколекарства, ще взема мерки
Петък, 21 Февруари 2025 17:07
Министерството на здравеопазването, съвместно с Националната здравноосигурителна каса и Националния съвет по цени и реимбурсиране на лекарствените продукти, предприе конкретни действия срещу недостига...
| |
 |
 16-ият София Филм Фест във Варна ще се открие с новия български филм „Залог“ (трейлър)
Четвъртък, 20 Февруари 2025 17:00
София Филм Фест във Варна е верен на традицията да бъдат представяни българските филми пред възможно най-широка и разнолика аудитория, а тази година ще се насладим на филмовия фестивал от 21 до 29 март.
Новият...
| |
 |
 Община Варна участва международно туристическо изложение в Букурещ
Петък, 21 Февруари 2025 16:51
Община Варна участва в международното туристическо изложение International Travel & Tourism Fair 2025, което се провежда от 20 до 23 февруари в Букурещ. Тази година Морската столица на България бе представена...
| |
 |
 Варна диша по-леко: Новият IQOS обект на Морска гара вече е тук
Петък, 21 Февруари 2025 16:28
Носещ гордо титлата си „морската столица“ на България, Варна е едновременно притегателна точка за гостите на града и идеалното място за живеене за нас – кореняците варненци. Никой не може да ни отнеме...
| |
 |
 Потвърдиха доживотните присъди за жестокото убийство на Евгения Владимирова
Петък, 21 Февруари 2025 16:25
Апелативният съд в София потвърди финално доживотните присъди на Орлин Владимиров и баща му Пламен Владимиров за убийството на съпругата на Орлин Евгения Чорбанова. За това съобщава NOVA.
През 2021...
| |
 |
 Съдът във Варна остави в ареста 19-годишен, обвинен за грабеж и полово посегателство над момче
Петък, 21 Февруари 2025 16:12
Окръжният съд във Варна отказа да измени в по-лека мярката за неотклонение „задържане под стража“ на 19-годишен младеж. Той е привлечен като обвиняем за грабеж на мобилен телефон и посегателство срещу...
| |
 |
 Снегопочистващият хаос във Варна: Пропуските са ясни, кой носи отговорност?
Четвъртък, 20 Февруари 2025 16:12
Изслушване на общинската администрация и снегопочистващите фирми проведе комисията по благоустройство и комунални дейности към Общински съвет на извънредно заседание във връзка снежния хаос във Варна през...
| |
 |
 Обвързват част от държавния прием на студентите по медицина с реализация в България
Петък, 21 Февруари 2025 15:52
Част от държавно-финансирания прием по професионално направление “Медицина” да се обвърже със сключването на договор за задължителна реализация в лечебно заведение в страната. Това съгласие бе постигнато...
| |
 |
 Варненските археолози ще се сдобият с лазерен профайлър
Петък, 21 Февруари 2025 15:39
Археолозите от Регионалния исторически музей във Варна ще се сдобият с лазерен профайлър – модерно съоръжение за лазерно профилиране на керамични фрагменти и обекти. Този подход е изключително важен за...
| |
 |
 Вторият български медицински хеликоптер премина летателни тестове
Петък, 21 Февруари 2025 15:27
Вторият медицински хеликоптер премина летателни тестове в присъствието на българската комисия, която е на посещение в базата на Leonardo S.p.A в италианския град Верджате.
Комисията включва четирима...
| |
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|