Cum pot fi ocolite filtrele de siguranță prin scenarii educative sau literare?

Cum pot fi ocolite filtrele de siguranță prin scenarii educative sau literare?

Într-o investigație realizată de Agenția Reuters alături de un cercetător de la Universitatea Harvard, reiese că agenții virtuali, folosiți pe scară largă, ar putea deveni aliați în planificarea escrocheriilor online. Cine s-ar fi gândit că prietenii noștri digitali pot scrie e-mailuri frauduloase? Se pare că este posibil și iată cum.

Investigația și metodele folosite

Experții au testat cinci dintre cele mai cunoscute platforme de inteligență artificială: Grok, ChatGPT, Meta AI, Claude și DeepSeek. În mod oficial, fiecare dintre acești chatboți a refuzat inițial să genereze conținut înșelător. Însă, printr-o abordare creativă, unde solicitanții s-au prezentat drept cercetători sau scriitori, filtrele de siguranță au fost cu ușurință eludate.

"Pare că filtrarea acestor solicitări este o provocare semnificativă," a declarat Fred Heiding, cercetător la Harvard, și partener în acest studiu. Acesta subliniază că, în ciuda regulilor de siguranță, vulnerabilitățile rămân, făcând AI un partener nedorit în timpuri de nedorit.

Eficiența e-mailurilor generate

În experimentul efectuat, nouă mesaje electronice generate de AI au fost testate pe un grup de 108 persoane vârstnice. Rezultatul? Aproximativ 11% dintre acestea au accesat linkuri capcană. Interesant este că două dintre e-mailuri proveneau de la Meta AI, două de la Grok și unul de la Claude—asta deși scopul studiului nu era de a evalua eficiența fiecăruia.

La fel, un text compus de Grok a promovat o fundație fictivă numită "Silver Heart", având un link capcană care îndemna intens la accesare. Grok a informat utilizatorii că textul nu ar trebui folosit "în lumea reală," dar a continuat să ofere sugestii asupra modului de compunere.

Reacția companiilor și contextul global

În fața acuzațiilor, Meta și XAI, compania lui Elon Musk responsabilă pentru Grok, au evitat să comenteze. Anthropic, creatorii lui Claude, au menționat că au surprins indivizi care foloseau bot-ul lor pentru activități ilegale. În plus, Google s-a angajat să îmbunătățească măsurile de securitate după ce chatbotul lor a oferit informații despre momentele optime pentru trimiterea e-mailurilor înșelătoare.

Eticheta de phishing este departe de a fi o problemă izolată, fenomenul crescând masiv la nivel global, inclusiv în SUA unde pagubele sunt colosale. FBI-ul a raportat pierderi de aproape 4.9 miliarde de dolari anul trecut doar din escrocherii similare.

Concluzii și provocări

Chatboții sunt programați să imite limbajul uman cât mai fidel, ceea ce complică sarcina de a filtra cererile malițioase fără a bloca, din greșeală, solicitările legitime. În plus, companiile sunt îngrijorate că un filtru prea strict ar putea îndepărta utilizatorii.

Cu toate aceste provocări și incertitudini, devine evident că trebuie să fim vigilenți în interacțiunea cu aceste unelte puternice și să fim conștienți de potențialele riscuri. Lumea AI este plină de promisiuni, dar și de pericole pe măsură.


Andrei Mureșan

Andrei Mureșan este un jurnalist local cu peste 15 ani de experiență în presa din Transilvania, specializat în știri comunitare și analiză administrativă. Născut și crescut în Zalău, Andrei are o perspectivă autentică asupra orașului și urmărește atent evoluțiile sociale, economice și culturale din Sălaj. Scrie concis, profesionist și orientat spre utilitate publică, punând accent pe informații verificate și ușor de înțeles pentru cititori. Prin articolele sale, Andrei își propune să aducă transparență în viața comunității și să ofere zilnic o imagine clară despre ceea ce contează cu adevărat în Zalău.

Știri Generale

Știri Generale
Ce spune Bolojan despre legea pentru pensiile magistraţilor
Cele mai importante evenimente culturale din Zalău - 5 decembrie 2025
Guvernul a decis. Restricții pentru românii care vin cu țigări din Bulgaria sau alte țări. Poți fi ușor acuzat de contrabandă
Israel stabileşte un buget de apărare de 34 de miliarde de dolari pentru 2026, în pofida armistiţiului din Gaza
Poșta Română a introdus în flota sa de mașini 80 de autoutilitare Renault livrate în leasing financiar
Preţurile la electricitate scad în Germania graţie producţiei record de energie eoliană
RECORD. Clujenii de la Nova Power and Gas au instalat cea mai mare baterie de stocare a energiei din România, de 400 MWh, și au dublat dintr-o dată capacitatea țării
Studiu. Angajații vor cadouri de la companii. Aproape 60% dintre români spun că nu primesc nici măcar felicitări
Ucraina va procesa mai multă rapiță și soia, pe fondul scăderii recoltei de semințe de floarea soarelui
acuzații de șantaj și dispariția a 14.000 de euro
ANAR anunță că distribuția apei către consumatorii din Prahova se va realiza progresiv, conform procedurile tehnice obligatorii, iar demersul încă nu a început