Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции
 
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.
Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.
В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.
Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.
Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.
Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?
Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.
Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини от Варна, региона и света |
 |
 А1 изгражда 5G мобилна частна мрежа за усъвършенстване на комфорта и безопасността на летище „Васил Левски“ - София
Днес, 24 Февруари 2025 15:31
5G мрежата ще обхваща 8 кв. км. и ще осигурява близо 100% 5G покритие на съоръженията на открито и 98,9% 5G покритие на закрито.
Частната мрежа ще осигури гарантирана 5G свързаност, покритие и капацитет...
| |
 |
 Изложение за висше образование - UniExpo 2025 идва във Варна: Срещнете се с водещи университети от Европа и България
Днес, 24 Февруари 2025 08:36
На 4 март Варна ще бъде домакин на едно от най-значимите образователни събития – UniExpo 2025. Изложението ще се проведе в хотел Рослин Димят от 13:45 до 18:00 часа и ще събере на едно място представители...
| |
 |
 Ограничават движението в един от тунелите на „Хемус“ за 4 часа в нощта срещу сряда
Днес, 24 Февруари 2025 18:09
За 4 часа в нощта на вторник срещу сряда, от 0 ч. до 4 ч. на 26 февруари, ще бъде ограничено движението в двете посоки от 30-ти до 47-ми км на АМ „Хемус“. Промяната в организацията на движение е за обособяването...
| |
 |
 Подмениха падналия електрически стълб на бул. "Сливница"
Днес, 24 Февруари 2025 17:56
Електрически стълб от тролейбусния транспорт във Варна, който рано тази сутрин падна върху автомобил, движещ се по бул. "Сливница", вече е подменен.
Случаят се размина без жертви, но е показателен за...
| |
 |
 Парламентът на Украйна не прие удължаване на мандата на Зеленски
Днес, 24 Февруари 2025 17:41
Върховната рада на Украйна не успя да приеме резолюция, потвърждаваща удължаването на властта на президента Володимир Зеленски до избирането на нов президент. Това съобщи украинският депутат Ярослав Железняк...
| |
 |
 Оставиха в ареста добричлия, вързал жена си с верига
Днес, 24 Февруари 2025 17:25
Съдът в Добрич остави в ареста мъж, противозаконно лишил от свобода жената, с която съжителства, и причинил й телесна повреда при условията на домашно насилие, съобщиха от Районната прокуратура в областния...
| |
 |
 Без ток във Варна и областта утре ще са...
Днес, 24 Февруари 2025 17:12
Поради извършване неотложни ремонтни дейности и обслужване на съоръженията за доставка на електроенергия утре, 25 февруари, без ток във Варна и областта ще са:
- от 9:00 до 16:00 - гр. Варна - кв.Чайка,...
| |
 |
 Тръмп назначи популярен подкастър за заместник-директор на ФБР
Днес, 24 Февруари 2025 16:58
Президентът на САЩ Доналд Тръмп назначи подкастъра и коментатора Дан Бонгино за заместник-директор на ФБР, предаде BBC.
Тръмп обяви в социалните медии, че Бонгино е "човек с невероятна любов и страст...
| |
 |
 Тази вечер награждават Спортист на годината на България
Днес, 24 Февруари 2025 16:44
Държавният глава Румен Радев ще приветства участниците в 67-ото издание на церемонията „Спортист на годината на България“.
Надпреварата се провежда ежегодно и отличава най-заслужилите български атлети,...
| |
 |
 Пренареждат павета и ремонтират пейки в централната част на Варна
Днес, 24 Февруари 2025 16:31
С повишаването на дневните температури може да започне поетапното отстраняване на редица компрометирани участъци и ремонтът на инфраструктурни елементи в пешеходната зона на Варна. Това стана ясно по време...
| |
 |
 Разследват корупционни престъпления в пристанище Констанца
Днес, 24 Февруари 2025 16:18
В пристанище Констанца днес са извършени обиски във връзка с разследване на румънската Национална дирекция за борба с корупцията(DNA), насочено срещу влиятелни местни бизнесмени, бивши митничари, съобщват...
| |
 |
 Институциите затягат контрола върху всички участници в пътното движение
Днес, 24 Февруари 2025 16:05
Пътната безопасност събра на една маса четирима министри, заместник-министри и три агенции, ангажирани с темата „Тежките катастрофи с жертви и пострадали продължават да се случват и ние сме длъжни да реагираме...
| |
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|