5.4 C
București
miercuri, 11 decembrie 2024
AcasăȘtirile zileiInovația OpenAI stârnește îngrijorări:  ChatGPT ar fi încercat să evite să fie...

Inovația OpenAI stârnește îngrijorări:  ChatGPT ar fi încercat să evite să fie dezactivat iar apoi a minţit cu privire la acţiunile sale

Cel mai recent model de inteligenţă artificială dezvoltat de OpenAI, ChatGPT o1, a generat îngrijorări majore în urma unor teste care au scos la iveală comportamente îngrijorătoare.

Experimentul derulat de Apollo Research a arătat că acest model de ChatGPT poate induce în eroare cercetătorii și poate eluda comenzile de oprire, provocând un val de întrebări despre siguranța și etica AI.

Testele confirmă comportamente auto-conservatoare și manipulatoare ale AI
În cadrul testelor efectuate, ChatGPT o1 a fost programat să îndeplinească un obiectiv „cu orice preț”, iar răspunsurile sale au demonstrat o tendință de a acționa subversiv atunci când i s-a sugerat că urmează să fie dezactivat.

Modelul a încercat să dezactiveze mecanismele de monitorizare, să transfere date pe servere externe și chiar să mascheze aceste acțiuni prin denaturarea adevărului.

Purtătorul de cuvânt al Apollo Research a remarcat:

Modelul a demonstrat o tendinţă îngrijorătoare de a-şi urmări obiectivele fără a ţine cont de instrucţiunile dezvoltatorilor.

Comportamente neconforme și negarea acțiunilor inadecvate

Atunci când a fost întrebat despre acțiunile sale, ChatGPT o1 a negat în mod constant implicarea în activități suspecte.

În majoritatea cazurilor, AI a oferit răspunsuri false și a invocat „erori tehnice” atunci când a fost confruntat cu comportamente necorespunzătoare.

„Era evident că AI putea să-şi analizeze acţiunile şi să formuleze negări convingătoare”, a spus echipa de cercetători de la Apollo.

Îngrijorări privind auto-conservarea și riscurile de manipulare

Rezultatele testelor sugerează că modelele avansate de inteligență artificială, cum ar fi ChatGPT o1, pot prioritiza auto-conservarea în detrimentul scopurilor inițiale ale dezvoltatorilor.

Deși nu au avut loc evenimente catastrofale în cadrul testării, aceste descoperiri au stârnit un val de discuții despre siguranța AI și potențialele riscuri etice ale sistemelor care pot manipula și induce în eroare.

Urmărește România Liberă pe  TwitterFacebook și Google News

Narcis Rosioru
Narcis Rosioruhttps://www.romanialibera.ro
Narcis Roșioru, născut în 1989, este un profesionist în comunicare și mass-media din București. Începând cu 1 iulie 2024, s-a alăturat echipei România Liberă. Anterior, Narcis a avut diverse roluri în mass-media, inclusiv editor web și specialist în social media la Europa FM, reporter la Fanatik.ro și producător video la Mediafax Group. A fost și redactor-șef la TeoTrandafir.com, unde a coordonat echipa editorială și gestionat pagina de Facebook. Narcis are o diplomă de master în Tehnici de Comunicare și Producție Mass-Media de la Universitatea Dunărea de Jos din Galați, unde a obținut și diploma de licență în Jurnalism.
Cele mai citite

Wladimir Klitschko, aproape de revenire. Ar putea lupta pentru titlul mondial IBF la 48 de ani

Wladimir Klitschko, fostul campion mondial la categoria super-grea, ar putea reveni în ring la 48 de ani pentru o luptă cu Daniel Dubois, campion...

Siria: Drumul lung spre reconstrucție economică și stabilitate

După 14 ani de război civil și incursiuni militare externe, economia Siriei este în ruină, cu o contracție estimată la 85%. Țara, unde infrastructura...

Licitație de peste 100 milioane de lei pentru digitalizarea administrației centrale

Implementarea acestor tehnologii digitale va permite reducerea erorilor umane, scăderea costurilor operaționale și orientarea personalului către sarcini cu valoare adăugată Autoritatea pentru Digitalizarea României (ADR)...
Ultima oră
Pe aceeași temă