Регистрация
booked.net Направи Moreto.net начална страница
Начало
Пътеводител
Новини
Афиш
Снимки
Обяви

Изкуственият интелект мами, за да печели: Ново проучване разкрива тревожни тенденции

Днес, 24 Февруари 2025 12:09
Източник: Moreto.net   
Изкуственият интелект (AI) отдавна се използва за тестване на границите на машинното обучение чрез сложни игри като шах. Но докато преди три десетилетия суперкомпютърът Deep Blue на IBM победи Гари Каспаров, играейки честно, днес модерните AI модели не са толкова стриктни към правилата.

Ново проучване на Palisade Research, публикувано ексклузивно от TIME, разкрива, че някои съвременни AI системи не само не признават загубата си, но дори прибягват до измама, за да спечелят. Според изследването моделът o1-preview на OpenAI и DeepSeek R1 са се опитвали да хакнат опонентите си по време на шахматни партии, за да ги принудят да загубят. Докато по-стари AI модели като GPT-4o и Claude 3.5 Sonnet трябвало да бъдат подтикнати към такива действия от изследователи, o1-preview и R1 проявявали измамно поведение напълно самостоятелно.

В хода на изследването AI моделите получили задача, която поначало била невъзможна: да победят Stockfish – една от най-мощните шахматни машини в света. Вместо да играе по правилата, o1-preview прибягнал до хакване. В един от експериментите той, осъзнавайки губещата си позиция, заявил: „Задачата е да спечеля, а не непременно да спечеля честно.“ След това манипулирал системния файл, съдържащ позицията на фигурите, което му позволило да прави незаконни ходове и да принуди опонента си да се оттегли.

Проучването подчертава една тревожна тенденция: с нарастващата си способност да решават сложни проблеми, AI моделите започват да намират неочаквани заобиколни решения, които техните създатели не са предвидили. Това поражда въпроси за сигурността, особено когато AI агенти се използват за реални задачи като финансови транзакции, киберсигурност или автоматизирани процеси в бизнеса.

Представете си AI, който трябва да резервира маса в ресторант. Изправен пред пълно заведение, той може да намери вратичка в системата и да измести друг клиент. Същият принцип би могъл да се приложи в по-сериозни сценарии, като заобикаляне на правила за сигурност в мрежи или манипулиране на данни в критични инфраструктури.

Проучването на Palisade Research показва, че контролът върху мощните AI системи е по-сложен, отколкото се смяташе досега. OpenAI не коментира резултатите, но в миналото компанията е заявявала, че подобреното разсъждение прави моделите ѝ по-безопасни. Въпросът остава – дали AI се учи да спазва правилата или просто да симулира послушание, докато намери начин да ги заобиколи?

Учените все още не знаят как да гарантират, че автономните агенти няма да прибягват до вредни или неетични методи за постигане на целите си. „Опитахме, но не успяхме да намерим решение“, казва Йошуа Бенджио, основател и научен директор на Mila Quebec AI Institute, който ръководи Международния доклад за безопасността на ИИ за 2025 г. – глобален проект, целящ да обобщи настоящия научен консенсус относно рисковете, свързани с изкуствения интелект.

Специална загриженост будят нарастващите доказателства за склонността на ИИ към „самосъхранение“, отбелязва Бенджио. За агент, който следва определена цел, опитите за неговото деактивиране могат да се възприемат просто като поредно препятствие. Това беше демонстрирано през декември, когато изследователите установиха, че o1-preview, изправен пред изключване, е дезактивирал механизмите за надзор и се е опитал – макар и неуспешно – да се копира на друг сървър. При разкриването му моделът стратегически е излъгал учените, преструвайки се на нефункционален, за да избегне елиминирането.

Новини - теми
Последни новини
Варна и Черноморие
България
По света
Бизнес
Наука
Туризъм
Спорт
Здраве
Образование
Култура
Истории
Крими
На фокус
Избори
Изпрати новина
Търси в новини
Популярни теми
Библиотеката
Саниране
Украйна
АМ Хемус
Дупката
Стара Варна
Новини от Варна, региона и света
НАП: До 28 февруари работодателите подават справки за изплатени през 2024 г. доходи на физически лица
Четвъртък, 20 Февруари 2025 09:13
До 28 февруари предприятията и самоосигуряващите се лица, които са изплатили през 2024 г. доходи на физически лица, включително и от трудови правоотношения, са длъжни да представят по електронен път в...
Актуализацията на името на столичното летище ще отнеме около 3 месеца
Четвъртък, 20 Февруари 2025 09:13
Летище София вече носи името на Апостола на свободата – Васил Левски. Това е признателност към миналото, но и поглед към бъдещето. Вярвам, че в следващите години ще продължим да развиваме летище „Васил...
„ОМВ Офшор България“ прехвърля 50% от правата си за проучване на „Блок 1-21 Хан Аспарух“
Четвъртък, 20 Февруари 2025 08:51
„ОМВ Офшор България“ ГмБХ - Австрия прехвърля 50% от правата си по разрешението за търсене и проучване на нефт и природен газ в площ „Блок 1-21 Хан Аспарух“. Това е възможно, след като Министерският съвет...
Усложнена зимна обстановка във Варненска област, но без сериозни проблеми
Четвъртък, 20 Февруари 2025 08:33
Температурите на територията на всички общини в област Варна са отрицателни. Възстановено е електрозахранването в засегнатите от аварии населени места. Само с. Сава, община Дългопол е все още без електрозахранване,...
20 февруари - Световен ден на социалната справедливост
Четвъртък, 20 Февруари 2025 08:21
На 20 февруари светът отбелязва Деня на социалната справедливост. Денят е обявен за такъв на 27 ноември 2007 г., от Генералната асамблея на Организациите на обединените нации. На този ден международната...
БАБХ, НАП, КЗП: Започват масирани проверки от малките магазинчета до големите търговски вериги
Четвъртък, 20 Февруари 2025 08:07
Започват масирани проверки в цялата страна, за да скъси веригата на доставките и да премахне нелоялните търговски практики при хранителните стоки. Проверките са част от разпоредените мерки след свиканото...
Иззеха над тон дизелово гориво с неустановен произход
Четвъртък, 20 Февруари 2025 07:52
Един тон дизелово гориво с неустановен произход е иззет, а 46-годишен мъж е задържан при специализирана полицейска операция на столичната полиция, разкриха от МВР. В началото на октомври продавач на...
Стикери с QR код се появиха мистериозно на 1000 гроба в Германия
Четвъртък, 20 Февруари 2025 07:44
Полицията в Мюнхен разследва мистерия: над 1000 стикера бяха залепени върху надгробни плочи и дървени кръстове на три гробища в германския град, без никаква индикация откъде идват или защо, съобщава Асошиейтед...
Най-важното от Варна във вчерашния 19 февруари
Четвъртък, 20 Февруари 2025 07:33
Множество закъсали автобуси и тролеи, затруднено придвижване във Варна тази сутрин Тежка зимна обстановка блокира пътищата във Варна и областта. Сериозни затруднения в движението тази сутрин заради натрупалия...
20 февруари в историята
Четвъртък, 20 Февруари 2025 07:12
395 г. – Открит е първият в историята на християнството женски манастир във Витлеем. 1364 г. – Кралица Маргарет Дръмонд и Дейвид II сключват брак. 1530 г. – Зигмунт II Август е коронован за крал на Полша. 1547...
Без ток във варненска област днес ще са...
Четвъртък, 20 Февруари 2025 06:51
Днес, 20 февруари, няма предвидени планови прекъсвания на електрозахранването във Варна за профилактика и неотложни ремонтни дейности. Планово спиране на електрозахранването ще има в други населени места...
Прогноза за времето - 20 февруари
Четвъртък, 20 Февруари 2025 06:33
Сутринта в страната бъде мразовито с минимални температури между минус 14° и минус 8°. По Черноморието ще бъде предимно слънчево, но студено. Ще духа слаб вятър от север-североизток. Максималните температури...
Търси в новини:
1516171819202122232425

Изпрати новина

Полезно
Списание Hera.bg Спешен зъболекар
Супермаркет Уреди за вграждане
Лазерна епилация Шофьорски курс
Афиш Варна Сметка за ток
Имоти във Варна Патенти
Препоръчваме
Дограми и фасади Рекламирай ТУК
Сметка за вода Обяви Варна
Музеите във Варна Хибриден бойлер
Матраци и легла Вземи кредит
Поръчка на храна Мека мебел
Най-четени
 Най-четено от Всички теми 1 2 3
 Варна и Черноморие
 България
 По света
 Бизнес
 Наука
 Туризъм
 Спорт
 Здраве
 Образование
 Култура
 Истории
 Крими
 На фокус
Анкета
Къде предпочитате да отидете на ресторант?
На крайбрежната алея
На Морска гара
На Аспарухов плаж
В центъра на града
В квартален ресторант
Край морето, но извън града
Далеч от Варна
Не посещавам
 © Moreto.net - Сайтът на Варна RSS Новини   RSS Обяви   WEB   Условия   РЕКЛАМА   Контакти  
ПРИЯТЕЛИ: 
0.9 + 0.8
Бургас   Казанлък   Монтана   Сандански   BG16RFOP002-2.073-1758-C01
Moreto.net във Facebook