Регистрация
Направи Moreto.net начална страница
Начало
Пътеводител
Новини
Афиш
Снимки
Обяви

Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции

Днес, 24 Февруари 2025 12:09
Източник: Moreto.net   
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.

Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.

В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.

Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.

Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.

Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?

Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.

Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.

Новини - теми
Последни новини
Варна и Черноморие
България
По света
Бизнес
Наука
Туризъм
Спорт
Здраве
Образование
Култура
Истории
Крими
На фокус
Избори
Изпрати новина
Търси в новини
Популярни теми
Библиотеката
Саниране
Украйна
АМ Хемус
Дупката
Стара Варна
Новини от Варна, региона и света
ДПС-ДПС с ултиматум към управляващите
Неделя, 23 Февруари 2025 08:45
"Демокрация, права и свободи - ДПС" с ултиматум към управляващите. Приближените до Ахмед Доган поискаха да се изпълни споразумението за съвместно управление, което според тях означава назначаване на техни...
Норвежки филм грабна голямата награда на „Берлинале“
Неделя, 23 Февруари 2025 08:28
"Мечти" на норвежкия режисьор Даг Йохан Хаугеруд спечели спечели наградата "Златна мечка" за най-добър филм на 75-ото издание на кинофестивала "Берлинале", предаде ДПА. Лентата разказва за млада жена,...
Полярният ни кораб акостира в Аржентина на път за родината
Неделя, 23 Февруари 2025 08:09
Аржентинският град Комодоро Ривадавия посрещна българския научноизследователски кораб "Св.Св. Кирил и Методий" (НИК 421), който посещава за втори път града по време на експедициите си до Антарктида. Корабът...
МВР със спешния действия след вандалските посегателства на протеста в София
Неделя, 23 Февруари 2025 07:50
Министърът на вътрешните работи Даниел Митов разпореди предприемането на спешни мерки и действия от полицейските органи в цялата страна за установяване и задържане на всички лица, отговорни за вандалските...
Днес е Неделя Месопустна, последният ден, в който се яде месо преди Великите пости
Неделя, 23 Февруари 2025 07:31
Месни Заговезни (Неделя месопустна) е последният ден, в който се яде месо преди Великденските пости. Празникът е с плаваща дата, а през 2025 март се пада на 23 февруари. Денят винаги съвпада с неделята,...
Най-важното от Варна във вчерашния 22 февруари
Неделя, 23 Февруари 2025 07:14
Събарят обекти на крайбрежната алея във Варна (снимки) Фитнесът в района на Първа буна, заедно със заведение, вече са в миналото, съборени от багер. Напомняне: Подновете до края на февруари безплатните...
23 февруари в историята
Неделя, 23 Февруари 2025 06:58
303 г. – Римският император Диоклециан започва масови гонения срещу християните. 840 г. – Пиетро Традоник подписва Pactus Lotharii с франкския крал Лотар I, с което се осигурява независимостта на Венеция. 1796...
Прогноза за времето - 23 февруари
Неделя, 23 Февруари 2025 06:35
Днес ще е предимно слънчево. Преди обяд на отделни места в равнините и котловините видимостта ще е намалена. Ще духа слаб до умерен вятър от изток-североизток. Максималните температури ще са между минус...
Черно море и Лудогорец си разделиха по една точка
Събота, 22 Февруари 2025 20:13
Черно море и Лудогорец завършиха наравно 1:1 в мач от 22-ия кръг на елитната футболна група на България. И двата гола в мача паднаха през първата част. С точката Черно море изпревари Ботев (Пловдив) и...
33-годишен мъж задържан за лишаване от свобода и насилие над жена
Събота, 22 Февруари 2025 18:43
Районната прокуратура – Добрич задържа за 72 часа 33-годишен мъж, обвинен в незаконно лишаване от свобода и нанасяне на телесна повреда на жената, с която съжителства. И двата инцидента са извършени в...
Дженифър Лопес и Бен Афлек вече официално са необвързани
Събота, 22 Февруари 2025 18:18
Дженифър Лопес и Бен Афлек вече официално са необвързани. Според съдебни документи, получени от сп.People, бракът им е законно разтрогнат на 21 февруари 2025 г., въпреки че разводът е уреден още на 6 януари. Двойката...
Десетки пострадали по време на протеста срещу въвеждането на еврото, партиите коментират
Събота, 22 Февруари 2025 18:02
Десет полицаи са пострадали при ескалацията на напрежението по време на протеста на партия "Възраждане" срещу въвеждането на еврото. Протестиращите заляха с червена боя фасадата на представителството на...
Търси в новини:
345678910111213

Изпрати новина

Полезно
Списание Hera.bg Спешен зъболекар
Супермаркет Уреди за вграждане
Лазерна епилация Шофьорски курс
Афиш Варна Сметка за ток
Имоти във Варна Патенти
Препоръчваме
Дограми и фасади Рекламирай ТУК
Сметка за вода Обяви Варна
Музеите във Варна Хибриден бойлер
Матраци и легла Вземи кредит
Поръчка на храна Мека мебел
Най-четени
 Най-четено от Всички теми 1 2 3
 Варна и Черноморие
 България
 По света
 Бизнес
 Наука
 Туризъм
 Спорт
 Здраве
 Образование
 Култура
 Истории
 Крими
 На фокус
Анкета
Къде предпочитате да отидете на ресторант?
На крайбрежната алея
На Морска гара
На Аспарухов плаж
В центъра на града
В квартален ресторант
Край морето, но извън града
Далеч от Варна
Не посещавам
 © Moreto.net - Сайтът на Варна RSS Новини   RSS Обяви   WEB   Условия   РЕКЛАМА   Контакти  
ПРИЯТЕЛИ: 
0.7 + 0.6
Бургас   Казанлък   Монтана   Сандански   BG16RFOP002-2.073-1758-C01
Moreto.net във Facebook