Регистрация
Направи Moreto.net начална страница
Начало
Пътеводител
Новини
Афиш
Снимки
Обяви

Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции

Понеделник, 24 Февруари 2025 12:09
Източник: Moreto.net   
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.

Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.

В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.

Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.

Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.

Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?

Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.

Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.

Новини - теми
Последни новини
Варна и Черноморие
България
По света
Бизнес
Наука
Туризъм
Спорт
Здраве
Образование
Култура
Истории
Крими
На фокус
Избори
Изпрати новина
Търси в новини
Популярни теми
Библиотеката
Саниране
Украйна
АМ Хемус
Дупката
Стара Варна
Новини - Наука
Парад на планетите ни очаква тази вечер
Петък, 28 Февруари 2025 14:55
Зашеметяващ "парад на планетите" ще украси нощното небе тази вечер, като седем небесни съседи на Земята ще се присъединят към шоуто. В планетарния парад ще се включат 7 планети от Слънчевата система...
Част от Антарктическата ни експедиция се прибира днес в родината
Петък, 28 Февруари 2025 10:27
Предпоследната група участници в XXXIII-та Национална Антарктическа експедиция се завръща днес по обяд на летище „Васил Левски“ в София, с полет AZ 520 нa ITA Airways. В групата е и ръководителят на експедицията...
Президентът удостои с висши държавни отличия български учени
Четвъртък, 27 Февруари 2025 14:51
България може да се развива като модерна и просперираща държава само ако се отнасяме с уважение и признателност към хората на науката и прогреса. Това заяви държавният глава Румен Радев на церемония в...
Астероид носи името Перперикон
Вторник, 25 Февруари 2025 17:49
В базата данни в Центъра за малки планети в Харвард вече фигурира астероидът с българско име "Перперикон". Името е предложено от доц. Веселка Радева, ръководител на Планетариума във Висшето военноморско...
Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции
Понеделник, 24 Февруари 2025 12:09
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров,...
Черната дупка в центъра на Млечния път излъчва мощни изригвания (видео)
Събота, 22 Февруари 2025 15:27
Свръхмасивната черна дупка в центъра на Млечния път изглежда е домакин на зрелищно светлинно шоу, напомнящо диско топка. Благодарение на космическия телескоп „Джеймс Уеб“ на НАСА, астрофизици успяха да...
OneCourt създаде устройство, което позволява на слепи фенове да следят спортни мачове на живо
Петък, 21 Февруари 2025 13:32
За спортните фенове малко преживявания могат да се сравнят с емоцията от присъствието на жив мач на любимия отбор. За хората с увредено зрение обаче това често означава да се лишат от детайлния коментар...
Учени откриха нов метод за варене на яйца с перфектен резултат
Петък, 21 Февруари 2025 08:51
Въпреки че варенето на яйце изглежда като проста задача, постигането на идеалната текстура на белтъка и жълтъка е истинско предизвикателство. Причината е, че те се готвят най-добре при различни температури. Сега...
Полярният ни кораб отплава от Антарктида
Вторник, 18 Февруари 2025 17:38
Българският научноизследователски кораб „Св. св. Кирил и Методий“ отплава от Антарктида обратно към родината на 16 февруари, съобщават участници в 33-тата българска антарктическа експедиция. На борда...
Завърши реставрацията на първата статуя, открита в Големия канал на Хераклея Синтика
Неделя, 16 Февруари 2025 13:45
Първата статуя, открита от екипа на проф. д-р Людмил Вагалински в Големия канал на Хераклея Синтика през лятото на 2023 г., вече е напълно реставрирана и готова да заеме своето място в постоянната експозиция. Впечатляващата...
Учени откриха гъба, превръщаща паяците в зомбита
Неделя, 16 Февруари 2025 10:35
Учени в Европа откриха нов вид гъбички, които превръщат пещерните паяци в "зомбита". Тези гъбички примамват жертвите си извън мрежите им, след което причиняват преждевременна смърт и използват труповете...
НАСА сподели неочаквани детайли за Плутон и транснептуновите обекти
Четвъртък, 13 Февруари 2025 13:48
Учени от НАСА за първи път успяха да изследват структурата на Плутон и други малки ледени тела, намиращи се във външната част на Слънчевата система. Използвайки усъвършенствания инструмент Near Infrared...
Търси в новини:
1234567891011

Изпрати новина

Полезно
Списание Hera.bg Спешен зъболекар
Супермаркет Уреди за вграждане
Лазерна епилация Шофьорски курс
Афиш Варна Сметка за ток
Имоти във Варна Патенти
Препоръчваме
Дограми и фасади Рекламирай ТУК
Сметка за вода Обяви Варна
Музеите във Варна Хибриден бойлер
Матраци и легла Вземи кредит
Поръчка на храна Мека мебел
Най-четени
 Всички теми
 Варна и Черноморие
 България
 По света
 Бизнес
 Най-четено от Наука 1 2 3
 Туризъм
 Спорт
 Здраве
 Образование
 Култура
 Истории
 Крими
 На фокус
Анкета
Къде предпочитате да отидете на ресторант?
На крайбрежната алея
На Морска гара
На Аспарухов плаж
В центъра на града
В квартален ресторант
Край морето, но извън града
Далеч от Варна
Не посещавам
 © Moreto.net - Сайтът на Варна RSS Новини   RSS Обяви   WEB   Условия   РЕКЛАМА   Контакти  
ПРИЯТЕЛИ: 
1.2 + 1.0
Бургас   Казанлък   Монтана   Сандански   BG16RFOP002-2.073-1758-C01
Moreto.net във Facebook