Antrenează-ți LLM-ul

2025-04-08, 08:22

De doi ani am auzit de revoluția modelelor lingvistice masive, numite „inteligență artificială” pentru a suna mai deștept în presă. Am auzit cum deja 25% din codul de la Google este scris de AI. Rolul acestei postări este de a vă tempera un pic entuziasmul.

Ce reprezintă LLM-urile?

Nu o să vă explic ce sunt LLM-urile (am mai făcut-o), ci o să vă zic ce reprezintă. În momentul ăsta este un mijloc de a face bani rapid cam cum era explozia de startups din anii ‘10, o schemă Ponzi cu ocazionalul succes care să întrețină foamea de bani a fraierilor și bogaților. AI-ul sau LLM-urile sunt următoarea șmecherie care să facă bani de zece ori mai mult - deși deja sunt atât de mulți bani băgați în AI-ul ăsta încât habar nu am cine mai are bani să le dea băieților să le iasă de zece ori pe cât au investit.

LLM-urile sunt, așadar, încercarea disperată de a face 10x, așa cum a fost crypto (a meritat pentru cei care au investit acum 10 ani) și cum sperau să fie NFT-urile și acum LLM-urile. E doar următorul acronim care să-ți facă bani.

Studii despre impactul LLM-urilor

Nu prea sunt. Sunt puține făcute publice, și toate sunt inconcludente. Mai fiecare firmă mare și-a făcut un studiu intern în legătură cu eficiența LLM-urilor, și majoritatea nu le-au publicat - asta pentru că rezultatele sunt probabil nesatisfăcătoare. Din când în când mai apare câte-o informație ca cea din primul paragraf, dar știu cu destul de multă siguranță că acea statistică este o exagerare. Cifra reală este probabil mult mai mică, dacă ar fi zis ceva de genul 0.25% din codul Google e AI aș fi zis ok, sună credibil. Asta pentru că știu suficient de mult despre coding practices la Google încât să știu că e imposibil ca AI-ul să contribuie un sfert din codul lor lunar/anual.

Dar o să le luăm minciuna ca și cum ar fi adevărată, și o să vă propun următorul exercițiu: dacă 25% din cod este scris de AI, asta înseamnă că restul de 75% e făcut de oameni, nu? O regulă de trei-simplă ne spune că Google livrează cu 33% mai mult produs, ori nimic, dar nimic la Google nu arată anul ăsta a 133% din ce făcea anul trecut.

Cu alte cuvinte nu văd sporul de productivitate. Dar să fac o pauză și să restrâng un pic câmpul, pentru că o să vorbesc de productivitate într-un singur câmp: în IT, în programare, că ăsta e câmpul pe care îl cunosc. Știu, de exemplu, că pentru oamenii de marketing e o unealtă de mare ajutor. Pentru manageri ar putea fi iarăși o unealtă interesantă. Sunt sigur că sunt câteva servicii care sunt îmbunătățite sau pot fi automatizate cu LLM-uri. Dar nu despre asta vorbesc.

Bun, deci, revenind, în programare nu există acest spor de productivitate. Nu îl vezi nicăieri. Nu se vorbește nicăieri de productivitate. YouTube Music și YouTube încă au butonul de like și dislike inversate, Gmail încă e incapabil să respecte Dark Mode, un feature pe care îl are și cel mai cretin săituleț de primărie comunală. Doar prețurile sunt un pic mai mari pentru că AI, că no, inflație și AI-ul moare de foame, vrea venituri mai mari sau ceva.

Studiile sunt puține - la fel ca în cazul Rust, un alt copil umflat cu pompa în lumea programării, studiile sunt viciate de proceduri teribile. Cam tot ce s-a publicat e de slabă calitate, self-reported.

Microsoft se trezește

Dacă vă uitați cu atenție în jurul vostru o să vedeți că lumea vorbește cu aceeași vervă despre LLM-uri ca acum doi ani, cu o excepție. Satya Nadella a declarat într-un interviu destul de recent că obiectivul nu este AGI (Artificial General Intelligence), adică un AI care să fie bun la toate și să aibă și inițiative personale. Mult mai realist, el spune că scopul investițiilor în LLM-uri este „o creștere economică de 10%”. 10%, nu 1000%.

Cred că realismul l-a lovit recent - că a fost vorba de inaugurarea lui Trump sau de faptul că întrevedea dezastrul economic rezultat, omul și-a redefinit relația cu obiectivele AI-ului. Între timp, doar fraierii au rămas fixați pe fascinația cu LLM-urile. Ce s-a schimbat? În primul rând, cred că Nadella are acces la studiile la care nu avem noi acces. Și știe care e informația reală din spatele lui „25% din cod e generat de LLM”. Noi încă nu o știm. Asta îl ajută să se orienteze corect spre viitor - și chiar dacă promite miliarde investite în datacenters, deja a mai tăiat din ele. Promisiunile nu dor pe nimeni.

Dar nu toată lumea pricepe chestia asta. Firmele mari continuă să împingă LLM-urile de parcă ar fi un spor de productivitate garantat - forțându-și oamenii să folosească LLM-uri și crescând automat cifrele de folosire. Nu de productivitate, pentru că productivitatea nu se măsoară așa. De fapt, în domeniul ăsta productivitatea e suficient de greu de măsurat, și fiecare măsurător își definește propriile metrici care nu prea au legătură foarte mare cu realitatea. Programarea este (și) un domeniu creativ și creativitatea și productivitatea nu se împacă în măsurători.

Ce suspectez e că Nadella știe că LLM-urile nu sunt sporul de productivitate reală pe care îl promiteau. Că probabil există câteva meserii care profită de noua unealtă, dar majoritatea nu aduc un spor de productivitate reală. Și mai este încă o problemă: folosirea LLM-urilor este dăunătoare pentru „knowledge workers”, adică exact cei care ar trebui să profite de LLM-uri. Asta e marea critică a LLM-urilor, pe care oamenii din zona asta o tot reclamă, mai ales când văd LLM-urile îndesate pe gâtul oamenilor care sunt încă în proces de creștere/învățare.

Antrenează-ți LLM-ul

În mod normal ți-aș spune ție, cititorule, că nu merită să folosești mașina de furt, indiferent că e vorba de cea de la OpenAI, Meta, Claude, Google, sau Deepseek. Dar nu o să ai de ales. Curând va fi imposibil - ți se va impune să o folosești, și unele lucruri vor fi imposibil de făcut fără - așadar, realist vorbind, vei folosi o formă de „inteligență artificială”. Dar sunt câteva lucruri care trebuie să le menții în vizor:

LLM-urile sunt comercial neviabile, sunt mult prea costisitoare, deci este foarte probabil ca accesul la LLM-uri să devină mult mai costisitor dacă nu imposibil în viitorul apropiat. Pregătește-te, așadar, pentru momentul în care nu mai ai acces la LLM-uri.
LLM-urile sunt construite pe furt de informație (Meta a descărcat Anna’s Archive, ffs), deci inevitabil răspunsurile pe care ți le dă sunt cu un statut dubios în ceea ce privește drepturilor intelectuale. Ce produci folosind LLM-urile s-ar putea să încalce drepturile intelectuale care îți transformă produsul în ceva amendabil sau chiar ilegal (dacă informația încalcă regulile de export).
Soluțiile LLM-urilor sunt mediocre prin definiție. Dacă vrei excelență, LLM-ul nu ți-o va da.
Responsabilitatea pentru produsele LLM-urilor îți aparține ție, utilizatorul LLM-urilor. Nu poți să dai vina pe mașina care a scris codul sau a produs documentele - ci pe cel care a copiat ce a zis LLM-ul și a adăugat în produsul final. Nu-și asumă Meta, Google sau Deepseek responsabilitatea pentru ce faci tu la tine în curte.
Fiecare moment în care ai primit soluția de-a gata este un moment în care nu ai învățat tu cum se face o chestie. Ai devenit un simplu revizor, un muncitor necalificat care cel mult verifică niște lucruri. Cu alte cuvinte, mașina poate că știe cum să rezolve problema respectivă, dar tu nu. Ești, așadar, înlocuibil.

De-asta insist: antrenează-ți LLM-ul. Și tu ești un LLM, și tu trebuie să fii „antrenat”. Încă ești mult mai complex și mult mai ieftin ca o mașină. Nu poți face task-uri repetitive foarte bine, pe când mașina poate. Pune-o la muncă, fă-o să repete soluțiile pe care tu le-ai dat la problemele pe care tu le-ai identificat.

Dar asta a fost situația mereu în meseriile intelectuale. Cine nu continuă să se pregătească, cine nu e activ implicat, cine nu învață continuu este înlocuit sau eliminat. Și dacă, așa cum foarte mulți programatori constată, tot ce poți face tu poate fi făcut de LLM, ăla e un semn că mai ai de învățat.