Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции
 
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.
Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.
В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.
Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.
Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.
Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?
Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.
Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.
|
Новини - теми |
Търси в новини |
Популярни теми |
|
 |
Новини от Варна, региона и света |
 |
 "Стъпяй, пристъпяй" – концерт-спектакъл, пресъздаващ българските сватбени традиции, с премиера във Варна
Петък, 21 Февруари 2025 13:47
Премиерата на концерт-спектакъла „Стъпяй, пристъпяй“ ще се състои днес от 18:30 ч. в зала 1 на Фестивалния и конгресен център във Варна, предлагайки на публиката вълнуващо пътешествие в света на българските...
| |
 |
 OneCourt създаде устройство, което позволява на слепи фенове да следят спортни мачове на живо
Петък, 21 Февруари 2025 13:32
За спортните фенове малко преживявания могат да се сравнят с емоцията от присъствието на жив мач на любимия отбор. За хората с увредено зрение обаче това често означава да се лишат от детайлния коментар...
| |
 |
 Какво ще бъде времето в събота по Черноморието?
Петък, 21 Февруари 2025 13:18
През следващото денонощие ще остане студено.
По Черноморето ще преобладава слънчево време. Значителна облачност ще има по най-южното крайбрежие и там ще превали слаб сняг. Ще духа умерен до силен северен...
| |
 |
 Асоциацията за иновативно земеделие ще подпомага за намаляването на производствените разходи
Петък, 21 Февруари 2025 13:03
Българска асоциация за иновативно земеделие, която е член на Българския фермерски съюз, ще разяснява на стопаните да намаляват своите производствени разходи. Това обяви председателят на организацията Мариян...
| |
 |
 Обновената Клиника по урология бе открита официално в УМБАЛ „Св. Марина“ – Варна
Петък, 21 Февруари 2025 12:49
В УМБАЛ „Св. Марина“ – Варна официално бе открита обновената Клиника по урология. Основният ремонт приключи в началото на 2025 г. и обновената клиника вече работи с пълния си капацитет, с пациенти от...
| |
 |
 Райони без вода днес във Варна
Петък, 21 Февруари 2025 12:35
Няколко района са без вода във Варна поради аварии, съобщиха от ВиК-дружеството.
- до около 16 часа - части от местностите "Добрева чешма", "Лозите" и "Черноморска панорама";
- до около 18 часа - местност...
| |
 |
 МРРБ: 23 млн. лева са нужни за ремонт на четирите буни във Варна
Петък, 21 Февруари 2025 12:18
23 млн. лева възлиза остойностяването на проекта за ремонт и възстановяването на четирите буни и дамбата край брега на Варна. Обектът е включен в инвестиционната програма на МРРБ към проектобюджета за...
| |
 |
 Онлайн пазаруването в ЕС нараства, но България остава последна с най-нисък дял на покупки през 2024 г.
Петък, 21 Февруари 2025 12:03
Онлайн пазаруването в ЕС продължава да нараства, като все повече потребители избират интернет за покупки. Според последното годишно проучване за използването на информационни и комуникационни технологии...
| |
 |
 Дара Екимова и Графа с нов общ сингъл „Нито миг“ (видео)
Петък, 21 Февруари 2025 11:49
Дара Екимова и Графа обединяват силите си в новия си общ сингъл „Нито миг“, който е плод на тяхното творческо партньорство. Музикалната идея идва от Графа, който създава част от бийта и мелодията, докато...
| |
 |
 Благотворителен концерт в полза на Дома за медико-социални грижи за деца днес във Варна
Петък, 21 Февруари 2025 11:34
Благотворителен концерт в полза на Дома за медико-социални грижи за деца – Варна в кв. „Виница“ ще се проведе под патронажа на кмета Благомир Коцев. Организатор на инициативата е Фолклорен танцов клуб...
| |
 |
 България и Италия обсъдиха възможностите за активизиране на икономическите отношения
Петък, 21 Февруари 2025 11:21
Възможностите за активизиране на търговско – икономическото сътрудничество обсъдиха министърът на икономиката и индустрията Петър Дилов с Н.Пр. Джузепина Дзара, посланик на Италия в България. В срещата...
| |
 |
 ГДБОП разкри организирана група за данъчни престъпления и изпиране на пари с луксозни автомобили (видео)
Петък, 21 Февруари 2025 11:09
ГДБОП проведе специализирана операция срещу организирана престъпна група, извършвала данъчни престъпления и изпиране на пари в особено големи размери чрез търговия с луксозни автомобили. До момента е установено,...
| |
|
Изпрати новина
|
|
|
 |
Полезно |
Препоръчваме |
Най-четени |
Анкета |
|