Dieta cu resturi: De ce marile modele de AI se îneacă în propriul zgomot
Technology
Link
Important
Până nu demult, dogma centrală a industriei tehnologice părea de o simplitate aproape biblică: cu cât mai multe date, cu atât mai multă inteligență. Am asistat la un deceniu în care aspiratoarele digitale ale Silicon Valley au absorbit tot ce a produs vreodată mintea umană pe internet, de la tratate de filozofie până la rețete de chec și comentarii obscure pe forumuri. Această strategie a funcționat spectaculos pentru text, dându-ne iluzia că ChatGPT și semenii săi „înțeleg” lumea. Totuși, ne aflăm astăzi într-un moment de cotitură unde această bulimie informațională își atinge limitele biologice și fizice. Inteligența artificială nu se mai luptă acum cu lipsa de acces, ci cu o formă insidioasă de obezitate digitală alimentată de „junk data”.
Problema devine acută pe măsură ce ambițiile noastre migrează din spațiul abstract al chat-ului către lumea fizică. Există o diferență fundamentală între a genera o poezie despre ploaie și a antrena un robot care trebuie să plieze haine sau un sistem chirurgical care trebuie să navigheze prin țesut viu. Aceste „modele de lume” (world models) nu pot fi pur și simplu descărcate de pe un server. Ele necesită o înțelegere profundă a legilor fizicii, a texturilor și a imprevizibilului material. Din păcate, în goana lor după volum, companiile de AI au început să consume date de o calitate tot mai îndoielnică, un proces care, în loc să rafineze cogniția mașinii, o degradează.
Este un cerc vicios alimentat de o piață de miliarde de dolari. Startup-uri uriașe promit să „hrănească” foamea insațiabilă a giganților tehnologici, însă cantitatea livrează adesea doar zgomot de fond. Atunci când un sistem de conducere autonomă este antrenat cu date simulate prost sau cu informații redundante, el își pierde capacitatea de a distinge între ceea ce este tipic și ceea ce este posibil. Un copil care fuge după o minge într-o după-amiază cu soare orbitor nu este o variabilă statistică, ci o realitate care necesită o precizie chirurgicală, pe care junk data pur și simplu o diluează.
Eșecurile încep deja să iasă la suprafață, uneori sub forma unor retrageri strategice mascate de comunicate corporatiste. Cazul Sora, instrumentul de video generativ de la OpenAI care părea să rescrie regulile cinematografiei, este simptomatic. Dincolo de spectacolul vizual, sistemul a demonstrat lacune fundamentale în înțelegerea cauzalității fizice — obiecte care dispar sau se topesc în moduri care sfidează logica elementară a universului nostru. Aceasta nu este o eroare de programare, ci o limitare de nutriție informațională. Fără o dietă bogată în date care respectă gravitația și rezistența materialelor, AI-ul rămâne un visător lucid, incapabil să interacționeze coerent cu realitatea.
Mai mult decât atât, ipoteza scalării — ideea că un creier digital mai mare va deveni automat mai deștept — se lovește acum de zidul calității. Nu mai este suficient să avem biblioteci infinite dacă paginile lor sunt pline de greșeli de tipar și halucinații. Inginerii de elită realizează că adevărata frontieră nu mai este colectarea, ci distilarea. Viitorul aparține laboratoarelor care vor avea curajul să arunce 90% din date pentru a le păstra pe acelea care au cu adevărat greutate cognitivă.
În final, marea cursă pentru inteligența artificială fizică s-ar putea să nu fie câștigată de cei care au cele mai mari baze de date, ci de cei care înțeleg că un gram de experiență autentică valorează mai mult decât un terabit de zgomot sintetic. Ne-am petrecut ultimii ani învățând mașinile să vorbească ca noi; acum trebuie să le învățăm să vadă și să simtă lumea așa cum este ea, în toată complexitatea ei brută și neformatată. Rămâne de văzut dacă vom avea răbdarea de a cultiva această inteligență în mod organic sau dacă vom continua să o hrănim cu resturi, sperând la un miracol care întârzie să apară.
You must be logged in to add a comment. Login.
Se încarcă comentarii...