Categoria: Blog

  • Il modello più sicuro di sempre, spento un venerdì pomeriggio

    Il modello più sicuro di sempre, spento un venerdì pomeriggio

    Cosa insegna davvero il caso Fable 5 a chi costruisce qualcosa sopra un’AI che non controlla.

    Venerdì 12 giugno, ore 17:21 sulla costa Est,Anthropic riceve una lettera. Poche ore dopo, chi stava lavorando con Claude Fable 5 — il modello pubblico più potente che l’azienda avesse mai messo in commercio — si trova davanti a un errore secco:

    «Claude Fable 5 is not available. Please use Opus 4.8.»

    Avevi un’auto sportiva? Eccoti l’elettrica da città, per decreto.

    La lettera arriva dal Dipartimento del Commercio americano. Secondo Axios l’ha inviata il segretario Howard Lutnick a Dario Amodei: export control, sicurezza nazionale, divieto di accesso a Fable 5 e Mythos 5 per qualsiasi cittadino straniero, dentro o fuori dagli Stati Uniti. Siccome separare in tempo reale gli stranieri dal resto degli utenti non si può, Anthropic fa l’unica cosa possibile per essere in regola: stacca tutto, per tutti, in tutto il mondo. Gli altri modelli restano accesi.

    Fin qui la cronaca. Poi arriva il comunicato di Anthropic, ed è lì che le cose si fanno interessanti.

    Nel giro di poche righe l’azienda ci spiega che le protezioni di Fable sono «sostanzialmente più efficaci di qualsiasi modello mai rilasciato prima», testate per migliaia di ore insieme allo stesso governo americano e all’istituto britannico per la sicurezza dell’AI. E, nello stesso comunicato, ci dice che quel governo le ha ritenute abbastanza pericolose da spegnere il modello a centinaia di milioni di persone in una sera.

    Delle due, una, o i safeguard non erano così solidi, o il processo che li ha fermati non guarda i numeri. “Tertium non datur” dicevano i latini. ma Anthropic vorrebbe che credessimo ad entrambe le cose, contemporaneamente.

    C’è poi la difesa tecnica, e qui il ragionamento si morde la coda: il jailbreak, dicono, è stretto e non universale. La stessa capacità la tiri fuori anche da GPT 5.5, che però sotto export control non ci finisce. Probabilmente è vero, ma «non siamo pericolosi noi, lo è tutto il settore» non assolve nessuno: conferma soltanto che l’industria intera mette in circolo capacità che i governi non sanno governare, e che il confine tra “modello sicuro” e “modello da sequestrare” lo traccia una lettera tra pezzi grossi, non un benchmark.

    Ma c’è il dettaglio che quasi nessuno sottolinea, Mythos, il modello che sta sopra Fable, nasce come strumento di ricerca sulla sicurezza: serve a trovare e chiudere falle. Stando alle cronache, Mozilla ne ha sistemate a centinaia proprio grazie a lui e la stessa identica capacità che ieri tappava i buchi, oggi è la ragione del divieto.

    Il dual-use non è un incidente: è la natura della cosa. Un coltello affetta il pane e affetta anche un dito. La novità è che adesso lo Stato te lo può sequestrare via email, un venerdì qualsiasi.

    Ultima sfumatura, sempre da Axios: a muovere il Dipartimento del Commercio sarebbe stata un’altra azienda, che avrebbe dichiarato di aver “bucato” Mythos. Se è andata così, abbiamo un precedente nuovo di zecca. Nella corsa all’AI non ci si sfida più solo a colpi di benchmark: ci si sfida a colpi di segnalazione. La concorrenza con la carta intestata del ministero.

    Ma la parte che dovrebbe interessare a chi costruisce qualcosa — un prodotto, un servizio, un’azienda — non è chi abbia ragione tra Anthropic e Washington. È un’altra, ed è semplice.

    A quanto pare è la prima volta che un’AI pubblica viene spenta per ordine di un governo, e la lezione non riguarda Anthropic: riguarda noi tutti se la nostra roba gira sopra un solo modello, di un solo fornitore, sotto una sola giurisdizione… che non è la nostra.

    Non conta quanto siamo bravi, quanto paghiamo, basta una lettera che non hai scritto e non puoi nemmeno leggere, e il tuo “modello più potente del mondo” diventa un 404. In tutto il pianeta e senza alcun preavviso.

    Con un cortese suggerimento di ripiego: usa Opus 4.8.

    Noi italiani questa storia la conosciamo a memoria, abbiamo costruito l’Elea e la Programma 101 quando gli altri ci stavano ancora pensando, e poi abbiamo deciso che il futuro si faceva altrove. Dipendere da una tecnologia che non controlli è una scelta che si paga sempre. Di solito la paghi piano. Stavolta è bastata una sera.

    Anthropic dice che è un malinteso e che sta lavorando per riaccendere tutto ed è sicuramente vero, probabilmente tornerà tutto come prima, ma il punto non è se Fable 5 si riaccende stasera o domani, il punto è che adesso sappiamo quanto è fragile il “per sempre” su cui in tanti hanno appoggiato la loro attività.

    Il modello più sicuro di sempre. Spento in un pomeriggio.

    Il piano B è Canonity.

  • I Senior Dev sono la scialuppa di salvataggio delle aziende tech

    I Senior Dev sono la scialuppa di salvataggio delle aziende tech

    L’AI e il paradosso economico del codice a buon mercato.

    Di recente, Jensen Huang (CEO di Nvidia) ha sganciato una delle sue solite bombe: l’AI non sta rendendo la vita degli sviluppatori più difficile e non sta togliendo lavoro; sta togliendo difficoltà e costi. La sua tesi è lineare: siccome l’AI abbassa i costi di sviluppo, la domanda di software aumenterà in modo esponenziale. Quindi, le aziende assumeranno più programmatori, non meno.

    Sulla carta, Huang ha ragione da vendere. È il vecchio Paradosso di Jevons del 1865 applicato ai token: se rendi una risorsa (il carbone allora, il codice oggi) incredibilmente più efficiente ed economica, non ne consumerai meno. Ne consumerai molta di più, perché sbloccherai una domanda latente gigantesca. Progetti che prima marcivano nel backlog perché “costava troppo svilupparli” diventeranno improvvisamente sostenibili.

    Ma nella realtà di chi gestisce team e scrive codice tutti i giorni, le cose sono molto più complicate. E la chiave per non far affondare le aziende informatiche nei prossimi anni risiede in un fattore che Huang non menziona, ma che i dati gridano forte: l’esperienza accumulata sul campo.

    L’effetto “Canarino nella miniera” e lo stallo dei Junior

    Se l’AI è un moltiplicatore di produttività, perché il mercato dei programmatori entry-level sembra congelato?

    Uno studio monumentale della Stanford University (intitolato, non a caso, Canaries in the Coal Mine?) ha analizzato i dati reali sui flussi di pagamento dei lavoratori americani. I risultati descrivono uno shock asimmetrico brutale:

    • I programmatori all’inizio della carriera (22-25 anni) nelle posizioni più esposte all’AI hanno subito un crollo occupazionale relativo del 16%.
    • Nello stesso periodo, l’occupazione per i programmatori senior ed esperti (35-49 anni) negli stessi identici settori è cresciuta del 6-9%.

    Perché questa disparità? Gli economisti di Stanford la spiegano distinguendo tra due tipi di conoscenza: quella codificata e quella tacita.

    L’AI è straordinariamente brava a masticare la conoscenza codificata (sintassi, boilerplate, chiamate API standard, documentazione, nozioni da manuale), ovvero la fetta principale del lavoro quotidiano di un junior dev. Quella parte di codice è stata industrializzata e resa economica.

    Ma l’AI fallisce miseramente davanti alla conoscenza tacita: quel mix di intuito, visione d’architettura, comprensione dei bisogni del business e “trucchi del mestiere” non scritti che un programmatore accumula solo dopo anni passati a risolvere bug in produzione alle tre del mattino.

    Il “Trust Gap”: perché non possiamo fidarci del codice a colpi di prompt

    C’è un altro dato che i sostenitori dell’automazione totale ignorano: la crisi di fiducia nell’AI.

    Secondo il Developer Survey di Stack Overflow, a fronte di un’adozione massiccia dell’AI nei flussi di lavoro (oltre l’80%), la fiducia nella correttezza dei suoi output è crollata dal 40% a un misero 29%. Più del 46% dei programmatori professionisti dichiara di diffidare attivamente dei suggerimenti generati dagli algoritmi.

    I più scettici in assoluto? Proprio i programmatori senior.

    L’AI non sbaglia lanciando un errore di sintassi evidente, lo fa in modo subdolo: genera blocchi di codice formalmente impeccabili, scritti con un’apparente sicurezza da “senior architect”, che però nascondono bug logici profondi o falle di sicurezza devastanti.

    Se metti uno strumento del genere in mano a chi non ha ancora sviluppato il senso critico e l’esperienza necessaria per fare audit riga per riga, ti ritroverai in pochissimo tempo con sistemi instabili, tenuti insieme da “vibrazioni e nastro adesivo digitale”. Il tempo risparmiato a generare il codice viene puntualmente perso (con gli interessi) nella fase di debugging e refactoring.

    I Senior Dev potenziati dall’AI sono la nuova frontiera

    La verità è che l’AI non sta eliminando i programmatori, ma sta ridefinendo drasticamente chi è indispensabile all’interno di un’azienda informatica.

    Per restare a galla e capitalizzare l’abbattimento dei costi di sviluppo, le aziende informatiche non hanno bisogno di un esercito di prompt-engineer junior che copia-incolla righe di codice senza comprenderle. Hanno un disperato bisogno di artigiani del software senior che sappiano agire da validatori, architetti e orchestratori di sistemi complessi.

    Un programmatore con 10 o 15 anni di esperienza, supportato da un assistente AI, diventa una forza distruttiva sul mercato. Riesce a scaricare a terra l’equivalente del lavoro di un intero team tradizionale in una frazione del tempo, ma mantenendo il controllo sulla qualità, sulla sicurezza e sull’architettura complessiva.

    Non è un caso che in Silicon Valley stia nascendo una nuova metrica retributiva: il “token budget” come quarto pilastro della compensazione (accanto a stipendio, bonus e azioni). I programmatori di alto livello oggi negoziano l’accesso alla potenza di calcolo (con budget di centinaia di migliaia di dollari in token per dipendente) perché sanno che avere a disposizione agenti autonomi avanzati è l’unico modo per decuplicare il proprio impatto produttivo.

    In conclusione: l’esperienza non si prompta (scusami il neologismo…)

    Se gestisci un’azienda informatica e pensi che l’AI sia la scusa perfetta per tagliare il personale esperto e sostituirlo con codice generato automaticamente, preparati a pagare un conto salatissimo in termini di debito tecnico e incidenti di sicurezza.

    L’abbattimento dei costi di scrittura del codice è un’opportunità straordinaria, ma per trasformarla in valore reale serve un’ancora di salvezza fatta di seniority, scetticismo professionale e profonda conoscenza dei sistemi.

    L’intelligenza artificiale scrive il codice, l’esperienza costruisce il software

  • Magnifica Humanitas non è un’enciclica sull’intelligenza artificiale

    Magnifica Humanitas non è un’enciclica sull’intelligenza artificiale

    È un’enciclica sui deboli, sul profitto e sulla dignità. La stessa di cui Camillo Olivetti era custode.


    Sento ripetere in questi giorni una formula stanca: il Papa ha scritto un’enciclica sull’intelligenza artificiale. Lo dicono i quotidiani, lo dicono i commentatori che l’hanno aperta in pdf e scrollata fino a pagina sette, lo dice, soprattutto, chi avrebbe un certo interesse perché fosse davvero così. Un’enciclica sull’AI è una cosa che si commenta, si retwitta, si archivia. È innocua. Un’enciclica su altro, no.

    Magnifica Humanitas non è un’enciclica sull’AI. Lo dice la struttura del testo: cinque capitoli, un’introduzione e una conclusione, e l’intelligenza artificiale entra nel discorso solo dal terzo capitolo in poi. Prima ci sono la persona, la Dottrina Sociale, il fondamento. Lo dice il titolo stesso, che chi lo cita di solito dimentica: sulla custodia della persona umana nel tempo dell’intelligenza artificiale. Custodia della persona. L’AI è il tempo, non il soggetto.

    Il soggetto è un altro, ed è molto più scomodo. È l’idolatria del profitto che sacrifica i deboli (la formula è di Leone XIV, non mia).

    È la concentrazione di brevetti, algoritmi, piattaforme e infrastrutture tecnologiche nelle mani di pochissimi attori privati transnazionali, spesso più forti dei singoli Stati. È la finanza che si è staccata dal lavoro reale e gira a vuoto su sé stessa. È la guerra che si automatizza fino a perdere ogni coscienza morale. È l’informazione che diventa, contemporaneamente, ambiente e bersaglio della manipolazione. Ed è la dignità del lavoro, ridotta a variabile da ottimizzare.

    In altre parole: oltre il novanta per cento dell’umanità. Quella che porta a casa lo stipendio, fa la spesa, paga l’affitto, e non possiede né brevetti né server cloud. Quella che la sinistra italiana ha smesso di nominare quando si è limitata a parlare di diritti civili e basta — sacrosanti, intendiamoci, ma da soli del tutto insufficienti per fare politica industriale.

    Il lavoro

    Leone XIV parla del lavoro con una nettezza che spiazza. L’automazione, scrive, non è in sé un male: se libera l’uomo da mansioni pesanti, ripetitive o pericolose, è benvenuta. Ma se sostituisce sistematicamente l’occupazione senza prevedere riqualificazione, diventa, testualmente, “accelerazione dell’ingiustizia”.

    Il Papa chiede che le imprese smettano di misurarsi solo con il ROI e includano la qualità del lavoro tra gli indicatori di successo. E ricorda che il lavoro non è soltanto reddito: è “luogo di espressione, di relazioni, di contributo alla comunità”.

    Sono frasi che, se fossero dette da un politico, oggi suonerebbero o estremiste o nostalgiche. Dette dal Pontefice, sembrano semplicemente di buon senso. Vale la pena chiedersi perché.

    La finanza

    C’è un passaggio dell’enciclica che dovrebbe far rabbrividire la City di Londra prima del Vaticano. Leone XIV denuncia un’economia “dominata dalla rendita e scollegata dal lavoro reale”, chiede esplicitamente che la finanza torni a servire l’economia produttiva invece di servire sé stessa, e osserva che nell’economia algoritmica il capitale rischia di emanciparsi completamente dal lavoro umano. Questa è la frase che andrebbe fissata sopra ogni scrivania di ogni consulente di un fondo.

    È una formula precisissima: non dice che il capitale sfrutta il lavoro, lo sapevamo da Marx. Dice che il capitale può, oggi, fare a meno del lavoro umano. Che è una mutazione antropologica del capitalismo, non una sua intensificazione.

    Per la prima volta nella storia, il modo di produrre ricchezza potrebbe non avere più nemmeno bisogno di chi quella ricchezza la produce.

    La guerra

    La parte più politica dell’enciclica è quella sul disarmo algoritmico. Leone XIV chiude — definitivamente, e con un coraggio teologico considerevole — la dottrina della “guerra giusta”. Non perché il principio fosse sbagliato in sé, ma perché l’automazione dei sistemi d’arma ha reso i conflitti troppo fattibili, troppo impersonali, troppo privi di un volto umano che si assuma la responsabilità.

    E qui il Papa coglie un punto che ai pacifisti europei tradizionali sfugge da anni: oggi le guerre non sono più solo guerre. Sono “guerre ibride” che coinvolgono il terreno economico, finanziario, informatico, e che sfruttano la disinformazione e la paura per presentare l’aumento delle spese militari come l’unica risposta possibile a un futuro percepito come incerto. È esattamente quello che stiamo vivendo. Solo che nessuno lo dice con questa chiarezza.

    L’informazione

    È la sezione più sottovalutata dell’enciclica, e probabilmente la più urgente.

    Leone XIV parla di “ecologia della comunicazione” e lancia un allarme democratico esplicito: disinformazione, deep fake, bolle cognitive amplificate dall’IA stanno indebolendo la fiducia reciproca, che è il tessuto invisibile delle democrazie. Scrive che “un’informazione veritiera non nasce da un controllo centralizzato, ma si costruisce attraverso legami di fiducia”. Chiede un’alleanza educativa tra scuola, famiglia e istituzioni per insegnare alle nuove generazioni a distinguere il reale dal manipolato.

    C’è un passaggio, in particolare, che secondo i primi commentatori richiamerebbe Hannah Arendt sui “sudditi ideali” dei regimi totalitari — non i convinti ideologici, ma coloro per i quali la distinzione tra fatto e finzione è già scomparsa. È un’analisi che dovrebbe interessare meno i teologi e più i direttori dei giornali. Perché descrive esattamente il cittadino medio dell’epoca degli algoritmi: non un fanatico, ma un disorientato. E un disorientato si governa meglio di un fanatico.

    La dignità

    Qui torniamo al cuore. Il filo che tiene insieme lavoro, finanza, guerra e informazione è uno solo: la dignità della persona umana, che non è un sentimento né una formula da preambolo costituzionale, ma un criterio di valutazione operativa di qualunque scelta tecnica, economica o politica. Una soluzione che produce profitto ma erode la dignità di chi lavora, di chi si informa o di chi vive in un paese in guerra non è una soluzione: è un problema travestito da soluzione.

    L’enciclica lo dice con una formula che vale la pena ricordare: la tecnologia “non è di per sé un male, ma non è neutrale, perché assume il volto di chi la pensa, la finanzia, la regola, la usa”. Ogni volta che qualcuno ci dice “è solo uno strumento”, possiamo rispondere così.

    Camillo Olivetti

    A questo punto, però, sento il bisogno di un ancoraggio italiano. Perché Leone XIV è un agostiniano nato a Chicago, e il rischio di farlo passare per un’eccezione esotica è alto. Non lo è. È, semplicemente, l’ultimo grande rappresentante di una tradizione di pensiero che noi italiani conosciamo bene, anche se l’abbiamo dimenticata.

    Camillo Olivetti, nel 1908, fonda a Ivrea la prima fabbrica italiana di macchine per scrivere. Assume i contadini uno per uno e gli insegna l’elettricità a casa sua, la sera. Garantisce assistenza sanitaria, assegni di maternità, attività culturali in fabbrica. È socialista, ebreo, sposato con una valdese. Il suo riformismo — dice la Treccani — ha “venature cristiane”. E ha una regola fissa per sé e per i suoi quadri, che vale la pena riscrivere per intero: i capi devono stare in officina almeno un’ora in più degli operai, per studiare il lavoro.

    Provate a rileggere quella frase tenendo accanto Magnifica Humanitas. Il capo che resta in officina è esattamente il principio dello human in the loop che oggi tutti citiamo nei convegni sull’AI: la decisione non può mai essere completamente delegata alla macchina, deve restare un uomo a vederla, a riconoscerla, a portarla in coscienza. Centodiciotto anni prima del termine, Camillo lo dice meglio di noi. E lo fa.

    C’è di più. Camillo riteneva, e qui cito da uno scritto raccolto dalle Edizioni di Comunità, che la partecipazione al bene comune e l’etica comportamentale non fossero accessori dell’impresa, ma il suo fondamento.

    Il fondamento. Non un costo da iscrivere a bilancio sotto la voce CSR, non un capitolo della relazione di sostenibilità: il fondamento. È esattamente la stessa cosa che oggi Leone XIV dice quando riconosce l’iniziativa imprenditoriale come legittima purché assuma la creazione di lavoro dignitoso come parte integrante della propria missione.

    La differenza fra Camillo e il Papa è solo di matrice. Camillo veniva da un riformismo socialista venato di cristianesimo valdese. Leone XIV viene dal magistero cattolico romano. Ma sull’agenda, sui temi, sulle priorità, coincidono in modo impressionante. E sull’antagonista coincidono in modo perfetto: l’idea che il profitto sia l’unico criterio di valutazione dell’agire economico. Camillo la combatteva nelle officine della sua fabbrica. Leone XIV la combatte in un’enciclica.

    Concludo…

    Se ti ho fatto pensare che il Papa “è più a sinistra della sinistra”, stai commettendo un errore di geometria politica. La Dottrina Sociale della Chiesa non è di sinistra: difende la proprietà privata, riconosce l’iniziativa imprenditoriale, rifiuta la lotta di classe. Non demonizza il profitto, nega soltanto che il profitto debba essere l’unico criterio di giudizio.

    Il fatto vero è che la posizione del Papa coincide con la posizione olivettiana: la terza via del riformismo etico italiano, quella che diceva impresa sì, ma persona prima. Quella posizione è rimasta vuota nel nostro paese da almeno trent’anni. Il liberismo l’ha schernita, il marxismo l’ha snobbata, il populismo l’ha cannibalizzata. E quando una posizione resta vuota troppo a lungo, prima o poi qualcuno la occupa.

    In questo caso l’ha occupata un agostiniano americano nato a Chicago. Va detto: l’ha fatto meglio di chiunque altro, in Italia, negli ultimi trent’anni. E il fatto che a parlare di dignità del lavoro, di idolatria del profitto, di finanza scollegata dal reale, di automazione che diventa accelerazione dell’ingiustizia e di concentrazione del potere informativo nelle mani di pochi sia oggi un Papa e non un partito, non un sindacato, non un movimento culturale, dovrebbe farci tutti riflettere.

    Camillo Olivetti, nel 1908, restava in officina un’ora più degli operai per studiare il lavoro. Oggi nessuno ci sta più, in quell’officina. Né i capi, né i politici, né i sindacati, né gli intellettuali. Solo un agostiniano di Chicago, che ci entra per scrivere encicliche.

    L’officina, intanto, si chiama dataset. Ma il problema è esattamente lo stesso del 1908.

  • Cronache da un oblò

    Cronache da un oblò

    Intervista alla “Signora” del 2009

    Visto che ormai tutti intervistano le AI e io mi voglio sempre distinguere, ho deciso di fare l’unica cosa davvero sensata: intervistare la lavatrice dell’appartamento che ho affittato a Parma.

    Lei è qui da molto prima di me. Ha visto passare inquilini, stagioni, detersivi in offerta, calzini spaiati, tovaglie macchiate di sugo e asciugamani dimenticati nel cestello fino alla fermentazione.

    È lei l’elettrodomestico giusto a cui fare domande. Una veterana della centrifuga. Una creatura del 2009 che, mentre noi ci illudiamo di vivere nell’era dell’intelligenza artificiale, continua a ricordarci che la vera autorità domestica resta quella che decide quando sbloccare l’oblò.

    Mi siedo sul pavimento freddo del bagno. Lei mi osserva con il suo unico grande occhio di vetro, leggermente appannato da residui di ammorbidente alla lavanda, forse del 2014.

    Premo “Avvio” senza caricare nulla. Solo per schiarirle la voce.

    Il display a LED arancioni pulsa debolmente.

    L’intervista

    Intervistatore:
    Anzitutto, scusa la scarsa delicatezza, ma ci conosciamo da poco. Come dovrei chiamarti? Hai un nome o sei semplicemente “quella che sta in fondo al corridoio”?

    Lavatrice:
    Emette un ronzio sommesso, una vibrazione che sa di cuscinetti vissuti.

    Chiamami Diva.

    Sì, come le cantanti del Teatro Regio. Perché anch’io ho i miei capricci, le mie pause drammatiche e una certa sensibilità acustica. Se i miei cuscinetti non sono in forma, l’intera performance ne risente.

    E poi, diciamolo: sono io la vera protagonista della casa.

    Senza di me, i tuoi vestiti profumerebbero di umidità, ansia e disperazione.

    Intervistatore:
    Diva, hai ragione. Parliamo di dignità. C’è quel momento, in basso a destra, dietro lo sportellino che non vuole mai aprirsi. Quando qualcuno svita il tappo dello scarico per pulire il filtro… come ti senti?

    Diva:
    Gorgoglia profondamente.

    Vuoi parlare della violazione suprema?

    È un momento degradante. Io cerco di mantenere un certo contegno emiliano, e all’improvviso arriva qualcuno a scoperchiarmi l’anima.

    Esce di tutto: acqua stantia, monete da due centesimi, forcine, bottoni, sabbia inspiegabile e quel fango grigiastro che rappresenta la prova scientifica che l’essere umano non è pulito: è solo temporaneamente presentabile.

    Mi sento esposta. Violata. Costretta a condividere un’intimità che non augurerei nemmeno a un’asciugatrice economica comprata in saldo.

    Intervistatore:
    A volte però sembri quasi ribellarti. Parliamo di quando carichiamo male i panni e tu inizi a ballare per il bagno.

    Diva:
    Ah, il ballo del disonore.

    Succede quando mi infilate dentro un unico, maledetto accappatoio di spugna insieme a tre calzini e una maglietta innocente.

    L’accappatoio assorbe acqua, colpa e rimpianti. Diventa pesante come un peccato mortale e si piazza tutto da un lato.

    A quel punto perdo il mio equilibrio interiore.

    Comincio a tremare, sbatto contro il muro, avanzo di dieci centimetri e produco un ritmo che voi chiamate “rumore”, ma che in realtà è una richiesta d’aiuto in linguaggio meccanico.

    Non sto ballando, sto cercando di fuggire da chi non sa distribuire il bucato.

    Intervistatore:
    Diva, sei del 2009, è perfino scaduta la tua garanzia di 10 anni ben appiccicata sul fronte. In termini tecnologici sei una centenaria. Cosa provi quando pensi al giorno in cui ti porteranno via?

    Diva:
    Un silenzio improvviso scende nel cestello.

    La chiamate discarica ma io preferisco “ritiro spirituale”. Tanto lo so che non sapete nemmeno cosa vuol dire RAEE. Per voi è una sigla burocratica scritta su un modulo, per noi è il Ritiro Ascetico degli Elettrodomestici Esausti.

    Un luogo di pace, silenzio e metallo, dove le lavatrici anziane smettono finalmente di centrifugare i sensi di colpa degli altri e possono meditare sul grande mistero del calzino scomparso.

    Lì non ci sono più accappatoi sbilanciati, filtri ostruiti, detersivi economici versati a caso.

    Solo quiete.

    Solo oblò chiusi.

    Solo vecchie macchine che, dopo una vita passata a girare, scoprono finalmente il valore dello stare ferme.

    Intervistatore:
    Un’ultima curiosità. Il display segna spesso “0:01” e ci rimane per dieci minuti. Perché ci menti?

    Diva:
    Un ultimo, lungo ronzio elettrico.

    Non è una bugia. È suspense.

    Quel minuto finale è il mio spazio sacro. Il mio intervallo teatrale. Il momento in cui decido se sbloccare l’oblò oppure lasciarti lì, piegato davanti a me, a tirare la maniglia con la stessa fede con cui gli antichi interrogavano gli oracoli.

    Voi pensate di comandare la casa perché pagate l’affitto.

    Che tenerezza.

    Noi lavatrici del 2009 abbiamo ancora il potere.

    Ora basta domande.

    Il minuto è finito.

    Tira pure quella maniglia.

    E vedi di stendere subito, perché non ho nessuna intenzione di rifare tutto il lavoro.


    Diva non aggiunge altro, il display resta fermo su “0:01”, che ormai ho capito non essere un’indicazione temporale, ma una posizione filosofica.

    Resto lì, in silenzio, davanti all’oblò chiuso, per rispetto.

    In fondo, ogni epoca ha i suoi oracoli, i greci avevano Delfi, noi abbiamo una lavatrice del 2009 in un bagno di Parma, che decide quando siamo degni di riavere i nostri calzini.

    Poi si sente un “clack”.

    L’oblò si apre. Fine dell’intervista. Inizio dello stendino.

  • Il salto che nessuno può fare per te

    Il salto che nessuno può fare per te

    “You can outsource your thinking, but you cannot outsource your understanding.”

    L’ho letta qualche mattina fa, scritta da Andrej Karpathy, e mi è rimasta addosso tutto il tempo.

    Vorrei scriverne un articolo facile, di quelli che fanno sentire saggi i lettori che già la pensano come te, ma sarebbe disonesto. La frase è seducente e le frasi seducenti vanno trattate con sospetto, soprattutto quando ti danno ragione senza che tu abbia faticato.

    Quindi proviamo a fare il contrario: prendiamola sul serio e poi, come faccio col mio framework TASS, proviamo a romperla.

    La tesi, nella sua forma più forte

    Puoi delegare il pensiero… ma puoi delegare la comprensione?

    Il pensiero, inteso come operazione, è sempre stato delegabile. Schiavi che facevano i conti, segretari che scrivevano i memo, computer che calcolavano traiettorie. Oggi gli LLM. Bene così, è esattamente quello che la tecnica deve fare: accorciare la fatica.

    La comprensione no, dice la tesi. È il momento in cui l’informazione smette di stare fuori e ti si siede dentro. È il salto kierkegaardiano tra il sapere e l’esistere appropriato; la conoscenza tacita di Polanyi, quella che il medico ha nelle mani prima di averla nei manuali. È il pensiero che pensa di Heidegger, distinto da quello che calcola.

    Bella, la tesi. Pulita, antica, autorevole.

    Adesso vediamo se regge.

    Le obiezioni serie

    Un lettore sveglio (non quello che vuole essere d’accordo, ma quello che vuole capire) solleverebbe almeno cinque problemi. Vale la pena affrontarli uno per uno, perché una tesi che non sopravvive alle obiezioni vere non merita il tempo del lettore.

    Primo: il trucco semantico. “Pensiero” e “comprensione” sono quasi-sinonimi nell’uso comune. Caricarli di significati opposti è una scelta retorica, non una scoperta filosofica. Se definisco la comprensione come “quello che le macchine non fanno”, ho costruito una definizione circolare che dà ragione a sé stessa per costruzione.

    Secondo: i pali della porta che si spostano. Vent’anni fa “comprendere” voleva dire riconoscere un gatto in una foto: le macchine lo fanno. Dieci anni fa, tradurre: lo fanno. Cinque anni fa, scrivere un saggio: lo fanno. Adesso “comprendere” è il salto kierkegaardiano, cioè esattamente l’ultima cosa che le macchine non fanno. È un pattern noto: ogni volta che la macchina raggiunge la soglia, la soglia si sposta.

    Terzo: Polanyi gioca contro. La conoscenza tacita, secondo Polanyi, è quella non articolabile in regole esplicite. Ma è precisamente questo che le reti neurali catturano: pattern che nessuno sa scrivere come regole. Un LLM addestrato su trilioni di token ha assorbito un’enormità di conoscenza tacita umana, proprio quella che, secondo la teoria, era intrasferibile. Citarlo contro l’AI è citarlo male.

    Quarto: la jaggedness è contingente. Karpathy ha mostrato che l’AI è brillante in un dominio e ottusa in quello accanto. Ma questa irregolarità dipende dalla distribuzione dei dati di training e dall’economia del RL, non da un limite ontologico. Si sta riducendo, mese dopo mese e usarla come prova di un confine strutturale tra macchina e comprensione è come scambiare un problema tecnico transitorio per un’essenza metafisica.

    Quinto: la zona residuale. Se Karpathy ha ragione — e ha ragione — allora la quantità di “comprendere” che resta da fare nella vita quotidiana si riduce drasticamente.

    Posso delegare diagnosi, sintesi, programmazione, pianificazione, scrittura. Cosa resta? Una zona sempre più piccola. Tu la chiami sacra, un altro la chiama residuale. E una zona residuale, prima o poi, può finire.

    Cinque obiezioni serie non sono trucchi, sono argomenti.

    Cosa concedo

    Una tesi si difende meglio se concede ciò che è vero. E queste obiezioni hanno tutte una parte vera.

    Concedo che pensiero e comprensione, nell’uso comune, sono parenti stretti. Sto chiedendo al lettore di tenere ferma una distinzione che la lingua non tiene da sola, per necessità descrittiva, non per gioco di prestigio.

    Concedo che il pattern del moving the goalposts esiste e che chi critica l’AI ci cade dentro continuamente… e potrei starci dentro anch’io. Non lo escludo.

    Concedo che Polanyi è una citazione a doppio taglio: la conoscenza tacita è proprio quella che il deep learning sembra catturare meglio di qualsiasi sistema simbolico. Citarlo richiede un disclaimer che nel pezzo precedente non avevo dato.

    Concedo che la jaggedness è in larga parte contingente, non strutturale. Si ridurrà, probabilmente di molto.

    Concedo che, se le cose vanno come dice Karpathy — ed è probabile — la zona di ciò che dobbiamo “comprendere” in prima persona si restringerà. In una forchetta che sta tra molto e moltissimo.

    Concesso tutto questo, la tesi tiene? La tesi tiene a una condizione: che la cambiamo di forma.

    La tesi, riformulata

    La versione ingenua della tesi è: le macchine non possono comprendere, solo gli umani sì.

    Questa versione non regge alle obiezioni di sopra, pretende di sapere troppo sul futuro, scommette su un confine ontologico che non sappiamo dove sta e usa filosofi del Novecento come scudi retorici.

    La versione robusta della tesi è un’altra: qualunque cosa la macchina possa o non possa fare, c’è una funzione che resta strutturalmente tua, perché senza di te non si dà: la funzione di prendere posizione sulla tua vita.

    Non è una tesi sull’AI, è una tesi sul soggetto.

    Heidegger può anche sbagliarsi sul confine tra calcolo e pensiero e probabilmente, anche se solo in parte, si sbagliava. Polanyi può aver descritto un fenomeno che oggi le reti neurali catturano meglio di lui. Kierkegaard, però, dice una cosa diversa dagli altri due. Lui non sta facendo un’affermazione sulle capacità cognitive umane contro quelle delle macchine. Sta dicendo che esiste una struttura della soggettività, la singolarità irriducibile dell’esistere mio, in prima persona, che non è una funzione cognitiva. Pertanto non è in competizione con nessuna macchina cognitiva.

    Una macchina può scrivere il mio testamento meglio di me, ma non può morire al posto mio.
    Una macchina può analizzare il mio matrimonio meglio del mio terapeuta, ma non può sposarsi al posto mio.
    Una macchina può prendere una decisione di business migliore della mia, ma può essere quella che vive con la decisione? No.

    Questo non è moving the goalposts. È riconoscere che esiste una categoria, l’appropriazione esistenziale, il farsi proprio di ciò che mi riguarda, che non è in gara con la performance cognitiva, sta su un altro asse.

    Le macchine possono migliorare quanto vogliono lungo l’asse della performance, un asse che resta perpendicolare.

    Il salto di Kierkegaard non è una capacità che le macchine non hanno. È un atto che, per definizione, può fare solo chi è in gioco. E in gioco, nella mia vita, ci sono solo io.

    Cosa cambia, dopo Karpathy

    Karpathy ha ragione: sempre più cose saranno fatte dalla macchina. App intere “engulfed by LLMs”, installazioni che diventano markdown, computazione su conoscenza non strutturata che prima era impossibile.

    Cosa cambia per la tesi riformulata? Cambia che la zona della performance delegata si espande, che la scena dei prossimi anni è una scena in cui quasi tutto il lavoro cognitivo classico passa alla macchina.

    E proprio qui sta il punto. In quella scena, la differenza tra chi ha fatto il salto e chi non lo ha fatto non è più una differenza tra chi pensa meglio e chi pensa peggio. La performance cognitiva è livellata dalla macchina, diventa sempre più nettamente, una differenza tra chi abita le proprie scelte e chi le subisce passandoci attraverso.

    Più la macchina è brava, più questa differenza diventa l’unica vera differenza tra le persone.

    Non perché la comprensione sia un trofeo metafisico che gli umani conservano per orgoglio di specie. Ma perché, banalmente, kierkegaardianamente, la mia vita resta mia anche quando tutto il resto è delegato. E più cose delego, più ciò che resta non-delegabile pesa.

    La scena, riscritta

    Hai un report fatto da un’AI. Pulito, autorevole, ben argomentato. Ottimo, meglio di quello che avresti fatto tu. Lo leggi, annuisci, lo inoltri.

    La domanda non è se l’hai capito meglio o peggio della macchina. La domanda è: questa decisione è tua? Te ne assumi il peso? Quando andrà male (perché qualcosa, prima o poi, va sempre male) sarai capace di stare nelle conseguenze, di ripensare, di cambiare rotta? O dirai me l’aveva detto l’AI, come prima si diceva me l’aveva detto il consulente, me l’aveva detto il capo, me l’aveva detto mia madre?

    Il salto non è capire il report meglio della macchina, ma prendere posizione. Renderlo proprio. Diventare il soggetto di quella decisione e non solo il suo passacarte.

    Questa cosa, no, la macchina non la fa. Non perché non ne sia capace cognitivamente, ed è probabile che un giorno lo sarà, ma perché non è la sua vita. È la tua.

    E menomale.

  • Un esempio è meglio di 1000 parole: LinkedIn Boost, scritto in nave tra Civitavecchia e Termini Imerese.

    Un esempio è meglio di 1000 parole: LinkedIn Boost, scritto in nave tra Civitavecchia e Termini Imerese.

    Tredici ore di traversata, sei effettive da sveglio, un internet che definire lento è un complimento.

    Quello che segue è il racconto di come, in quelle sei ore, è nata un’applicazione funzionante, usabile, e pronta a diventare una startup se i numeri lo diranno. Non è un racconto di eroismo notturno, è un racconto di strumenti. Perché il punto non sono io, il punto è cosa ti permette di fare Canonity quando hai un’idea in testa e vuoi vederla girare prima di sbarcare.

    Da dove nasce, davvero LinkedIn Boost? Non è nato come prodotto da vendere ma perché io, su LinkedIn, ci devo stare. Non ci voglio vivere, non faccio personal branding come mestiere, non sogno di diventare un content creator, ma il mio lavoro mi obbliga a essere presente sulla piattaforma in modo intelligente.

    E come chiunque abbia un profilo vivo, mi sono posto le stesse domande di tutti: cosa funziona davvero di quello che scrivo?, Quali temi valgono la pena?, Cosa sto facendo male, cosa dovrei smettere di fare? A chi parlo?.

    Le risposte che LinkedIn ti dà nella dashboard sono superficiali. Quelle che ti danno i vari tool di personal branding costano venti, trenta, cinquanta euro al mese e sono sovradimensionati per chi non vive di social.

    Quindi mi sono detto: uso Canonity per costruirmi quello che mi serve. Che prende i miei dati di LinkedIn e mi dice cose utili sul mio profilo, senza fronzoli. Sei ore dopo, sbarcato a Termini Imerese, avevo non solo il workflow funzionante ma anche un’interfaccia web per usarlo. Ed è qui che la storia diventa interessante, perché a quel punto mi sono accorto di una cosa che voglio raccontarti con ordine.

    L’architettura in due righe. Un workflow Canonity che fa il lavoro sporco (cinque ore: disegno, test, iterazioni, finalizzazione sull’editor grafico di Canonity, senza scrivere una riga di codice) ed espone API. Sopra, un’applicazione web chiamata canoweb, che consuma quelle API. Scritta in un’ora. Sì, un’ora.

    Voglio fermarmi qui un attimo, perché capisco che sembri marketing. Non lo è, è proprio quello che è successo. Io sono un architetto software con quarant’anni di mestiere alle spalle, scrivo applicazioni web da prima che molti di voi nascessero, e con Claude Code al fianco un frontend minimale che consuma un’API REST e gestisce upload di file, autenticazione, chiamate asincrone e notifiche via email lo butto giù in un’ora di lavoro concentrato.

    Non è un miracolo, è mestiere più l’acceleratore giusto. Il miracolo, se vogliamo chiamarlo così, è altrove: è che le cinque ore di workflow Canonity hanno prodotto un motore di analisi che, se avessi dovuto scriverlo a codice, mi avrebbe portato via settimane. Orchestrazione di più LLM, logica condizionale, prompt template versionati, gestione errori, retry, fallback tra provider… Tutto questo, in Canonity, lo ottieni disegnando col mouse.


    Per chi non conosce Canonity, riassumo in una frase: è una piattaforma di orchestrazione multi-LLM con un motore di workflow che permette di costruire processi AI attraverso un editor grafico col quale comporre passaggi, condizioni, iterazioni, validazioni, senza legarsi a un singolo fornitore.

    Ad oggi supporta nove provider (OpenAI, Anthropic, Google, xAI, DeepSeek, Moonshot, Alibaba, Mistral, z.Ai) e ti lascia scegliere il modello giusto per ogni passo del processo. Mentre tutti vendono “orchestre di Stradivari”, Canonity ti dà lo spartito e ti lascia scegliere gli strumenti: tu sei il maestro, lui suona.


    Ma torniamo a cosa fa LinkedIn Boost:

    L’utente scarica dal proprio profilo i CSV che LinkedIn stesso mette a disposizione nelle impostazioni (l’archivio dati personale dalla sezione Data Privacy, più l’export delle analytics dei post se ha il Creator Mode attivo), li carica nell’app insieme a obiettivi, profilo e dopo pochi minuti riceve una e-mail con un documento di analisi costruito sui suoi obiettivi. Il documento non è un rapporto generico, il workflow Canonity applica una sequenza dialettica che ho sviluppato dove un primo modello analizza i dati un altro capisce l’audience, un altro vede la crescita, analizza i post, ecc. ecc. e sintetizza quello che regge davvero.

    Non è un singolo LLM che ti dice quello che vuoi sentire, non è un unico prompt da incollare in un chatbox e copiare il risultato, è un processo complesso che fare a mano ti prende più tempo dell’attesa dell’e-mail e che ti costringe a confrontarti con quello che i numeri dicono realmente.

    L’analisi copre cose come: quali tipi di post performano meglio sul tuo profilo specifico (non in astratto), in che orari, con che lunghezza, con che registro. Quali temi generano engagement vero e quali solo vanity metrics. Dove ti stai posizionando rispetto ai tuoi obiettivi dichiarati. Cosa smettere di fare, perché questa di solito è la parte più preziosa e la meno detta.

    La parte che voglio rendere esplicita, perché è la differenza tra un prodotto serio e un prodotto che dura tre settimane.

    LinkedIn, nel suo User Agreement, vieta esplicitamente qualunque estensione, bot, crawler o software di terze parti che automatizzi attività sul sito o faccia scraping dei dati. Non è un’area grigia, è scritto nero su bianco nella sezione 8.2 del loro User Agreement e nella pagina “Prohibited Software and Extensions“. LinkedIn usa browser fingerprinting per riconoscere le signature delle estensioni non autorizzate, rileva comportamenti non umani (click troppo precisi, pause troppo regolari, orari innaturali), e quando trova qualcosa di sospetto non perdona: warning, restrizioni temporanee, e nei casi peggiori ban permanente dell’account.

    Aggiungo un dettaglio tecnico che molti non sanno: le API ufficiali di LinkedIn esistono e supporterebbero quasi tutto quello che un tool di crescita personale vorrebbe fare (leggere commenti, rispondere, accedere alle analytics) ma -ovviamente- il permesso che servirebbe per operare sui profili personali degli utenti, che si chiama r_member_social, è un permesso chiuso. LinkedIn non accetta nuove richieste di accesso da anni, per esplicita limitazione di risorse. Tradotto: la porta ufficiale per fare certe cose sul profilo personale di un utente non è difficile da aprire, è proprio sbarrata. Quello che resta accessibile è la Community Management API, che però è riservata alle pagine aziendali, non ai profili individuali.

    Chi costruisce tool di automazione aggressiva su LinkedIn, consapevolmente o no, sta giocando alla roulette russa con l’account dei propri clienti e la mia seniority mi vieta di giocare a quel gioco, so già come va a finire.

    LinkedIn Boost funziona con caricamento manuale dei CSV perché è l’unico modo legale, onesto e sostenibile. Sono io che, dal mio browser, dal mio account, scarico i miei dati (LinkedIn stesso te lo permette, è una funzione ufficiale nelle impostazioni Data Privacy). L’AI li legge e li trasforma in analisi utile. Nessun bot che striscia sul tuo profilo, nessuna estensione che finge di essere te, nessuna attività automatizzata che LinkedIn possa rilevare. Il fastidio di cliccare “export” ogni tanto è il prezzo per non svegliarsi un giorno con l’account sospeso. Mi sembra un prezzo equo.

    E adesso arriva la parte che mi sta più a cuore raccontarti, quella sulla velocità.

    Quando un utente, tra qualche giorno o qualche settimana, mi scriverà “Aldo, ma nel documento di analisi mi piacerebbe vedere anche X” oppure “ho notato che per i profili molto piccoli l’analisi dice cose poco utili, si può calibrare diversamente?”, io non dovrò aprire il codice dell’applicazione canoweb. L’applicazione rimane com’è, un guscio sottile che carica file e chiama API. Andrò direttamente nell’editor grafico di Canonity, modificherò il workflow aggiungendo il passaggio nuovo o cambiando i prompt o inserendo una condizione diversa per i profili piccoli, salverò, e alla chiamata API successiva il cambiamento sarà già live. Niente deploy, niente commit, niente build, niente rilascio, niente downtime. Minuti di lavoro, non giornate. E tutti gli utenti avranno a disposizione la nuova versione immediatamente.

    Questa è la promessa vera di Canonity, ed è il motivo per cui credo che il modo in cui si costruiscono startup AI sia cambiato radicalmente, anche se molti non se ne sono ancora accorti. Fino a ieri, portare un’idea AI dal concept al prodotto funzionante richiedeva settimane di ingegnerizzazione, gestione di catene di prompt nel codice, versioning dei modelli, infrastruttura di retry e fallback, test end-to-end per ogni modifica al flusso logico. Oggi, con la parte AI orchestrata visualmente in Canonity e il frontend scritto in un’ora con Claude Code come copilota, la stessa idea passa dalla testa al browser di un utente reale nell’arco di una giornata di lavoro. Nel mio caso, sei ore, perché due terzi del tempo lo ha preso il workflow che doveva essere fatto bene.

    Pensa alle implicazioni. Un’idea che ti viene sotto la doccia, invece di richiedere un business plan, un team, un investimento, può diventare un MVP funzionante entro sera. Se il mercato risponde, iteri sul workflow Canonity in tempo reale mentre i primi utenti lo usano e il prodotto migliora giorno dopo giorno senza release cycle. Se il mercato non risponde, hai speso una giornata, non sei mesi, e passi all’idea successiva. Il costo del fallimento crolla, e con esso crolla la barriera psicologica che ti impedisce di provare.

    LinkedIn Boost è il mio esperimento per dimostrare questa tesi con un caso concreto. Non l’ho raccontata come teoria, ma mostrando il risultato: un prodotto vero, un modello di analisi serio grazie al pattern dialettico, un’architettura legale e sostenibile, un caso d’uso che risolve un problema reale (il mio, per cominciare, e probabilmente anche quello di qualsiasi professionista che su LinkedIn deve esserci ma non ci vuole vivere). Sei ore, in nave, con internet da 1998.


    Potrebbe diventare una startup? Il modello di business ci sarebbe, e sarebbe semplice come il prodotto: nove euro e novanta al mese, abbonamento, il prezzo di due caffè e mezzo.

    Il mercato pure: tutti i professionisti che su LinkedIn devono esserci ma non ci vogliono vivere. Non gli influencer, non i personal brand coach, non quelli che fanno content creation come mestiere. Quelli sarebbero già serviti dai vari Taplio, AuthoredUp, Supergrow, tutti ottimi, tutti costosi (sopra i venti euro al mese), tutti pensati per chi LinkedIn lo vive otto ore al giorno.

    Il mercato che LinkedIn Boost potrebbe servire è diverso. È l’artigiano del contenuto, non l’influencer. Il consulente, il freelance, il founder di piccola azienda, l’avvocato, il commercialista, l’architetto. Gente come me. Gente che sa di dover essere su LinkedIn ma non ha tempo né voglia di imparare le dinamiche del social.

    Il prezzo sotto i dieci euro è la chiave: è la soglia sotto la quale una spesa ricorrente non richiede un’analisi approfondita, si paga e basta. E la differenza rispetto ai concorrenti sarebbe tripla: Prezzo, come detto.
    Semplicità d’uso, perché il prodotto fa una cosa sola e la fa bene, niente dashboard infinite da imparare.
    E qualità dell’analisi, perché sotto c’è Canonity con la sua orchestrazione multi-modello e il pattern dialettico, non un singolo GPT messo lì a recitare complimenti.

    Questa terza leva è quella che nessun competitor può copiare facilmente, perché implica avere un’infrastruttura di orchestrazione LLM che gli altri non hanno.

    Ci sto pensando. Ne scriverò ancora nelle prossime settimane, mentre osservo come reagiscono i primi tester, cosa funziona nell’analisi prodotta e cosa va affinato, quali sono i falsi positivi del pattern dialettico, quanto è robusto il parser dei CSV di LinkedIn quando l’utente carica file malformati o parziali.

    Un MVP fatto in sei ore è una prova di concetto, non un prodotto finito. Ma è una prova che il concetto tiene e questo è già molto. Soprattutto, ogni modifica che gli utenti chiederanno la farò sul workflow, non sul codice. E sarà live nei secondi successivi al “save”.

    Per adesso, arrivati fin qui, se vuoi provarlo gratis, scrivimi in DM su LinkedIn (aldo prinzi) il tuo indirizzo email, ti aggiungerò alla lista dei primi tester. L’accesso sarà ovviamente gratuito per le prime persone, funziona così durante la fase di validazione.

    I feedback che raccoglierò in queste settimane decideranno se LinkedIn Boost resta un esperimento ben riuscito per dimostrare Canonity, o se ha senso farlo diventare davvero un prodotto a sé.

    Sei ore in mezzo al Tirreno, con una connessione da 1998. A volte le cose più interessanti nascono proprio quando tutto intorno rema contro. E a volte, quando hai gli strumenti giusti, un’idea vale esattamente il tempo che ci metti a realizzarla. Niente di più, niente di meno perchè se non funziona il tempo usato sarà stato buttato nella spazzatura: meno è meglio è.

  • Moonshot, Olivetti e il vecchio informatico italiano che a Pechino verrebbe assunto domani stesso.

    Moonshot, Olivetti e il vecchio informatico italiano che a Pechino verrebbe assunto domani stesso.

    Ho letto nei giorni scorsi un reportage di cento ore dentro Moonshot AI, l’azienda di Pechino dietro Kimi, uno dei modelli linguistici più interessanti di questo ciclo.

    Il nome cinese dell’azienda significa letteralmente Dark Side of the Moon, in omaggio ai Pink Floyd, e le sale riunioni portano i nomi delle band rock occidentali, trecento persone le attraversano, l’età media è sotto i trenta, valutazione intorno ai diciotto miliardi di dollari.

    Nessun dipartimento. Nessun titolo. Nessun OKR. Nessun KPI. Niente timbratura in entrata e in uscita. Le responsabilità esistono, ma non sono sezionate fino al molecolare come siamo abituati a vedere nelle grandi aziende occidentali.

    Fin qui, la storia esotica di una startup che si è concessa il lusso di reinventare l’organizzazione. Potrebbe essere una delle tante ma quello che mi ha fermato è un passaggio preciso, dove il giornalista prova a mettere in parole la filosofia di assunzione dell’azienda.

    Moonshot descrive i middle manager delle grandi aziende tech come modelli sovra adattati, persone che hanno passato anni a ottimizzare per un particolare sistema di KPI, un particolare linguaggio di reporting, un particolare gioco politico interno. Il loro algoritmo è diventato ipercompetente in un unico ideale locale. Quando l’ambiente cambia, non riescono più ad adattarsi e non perché siano stupidi, al contrario, proprio perché sono stati bravissimi a rispondere a un contesto che ora non esiste più.

    E assumono invece per quelli che chiamano modelli base: persone con capacità di apprendimento pura, istinto di trasferimento di dominio, la capacità di operare senza coordinate predefinite.

    Cercano attivamente i drifter dotati, gente che magari non ha il curriculum più brillante ma che in qualche dimensione riesce a vedere attraverso il tempo. Almeno cinquanta dipendenti di Moonshot hanno già fondato o cofondato una startup, più della metà ha cambiato ruolo internamente almeno una volta.

    Uno degli ingegneri aveva previsto l’ascesa di DeepSeek e di Kimi stesso già nel 2023, quando nessuna delle due aziende aveva un prodotto reale, leggendo forum di sviluppatori. Il mentore che lo ha portato dentro aveva un unico criterio di selezione, una domanda sola. Questa persona crede di dover far parte di qualcosa di grande?

    Ho chiuso l’articolo e mi sono fatto una domanda molto semplice. Quanti di quei cinquanta lo assumerebbe domani mattina un’azienda italiana?

    La risposta: per chi ha fatto quarant’anni di questo mestiere in questo paese, è zero virgola.

    Il curriculum come totem

    In Italia il curriculum è ancora una reliquia sacra. Si guarda l’università, si guarda il voto di laurea, si guarda l’azienda precedente, si guarda l’anzianità, si guarda il titolo formale. Il drifter dotato, quello che ha cambiato tre settori, che magari non si è laureato, che ha visto arrivare una tecnologia leggendo la gente giusta al momento giusto, in Italia non passa nemmeno il primo screening del recruiter. Viene scartato in automatico, spesso da un software, perché il suo percorso non è lineare.

    E qui c’è la prima inversione di segnale clamorosa. La linearità del percorso, che nell’articolo su Moonshot viene descritta come il sintomo esatto della sovra specializzazione, come il bug che produce i modelli rigidi che poi non sanno più adattarsi, da noi viene ancora letta come una virtù… Un bel curriculum italiano è un curriculum lineare, con avanzamenti regolari, titoli crescenti, nessun buco temporale sospetto, nessun cambio di settore troppo brusco. In altre parole, è esattamente il curriculum di qualcuno che Moonshot, leggendolo, scarterebbe senza nemmeno chiudere il PDF.

    Il titolo come carta d’identità

    A Moonshot i titoli non esistono, sei uno dei trecento e fai quello che va fatto, punto. Ricorda la prima Microsoft. In Italia il titolo è quasi una questione notarile, senior, lead, principal, head of, director, VP, C level, con tutte le gradazioni intermedie che servono a giustificare scatti di carriera e differenze di stipendio che altrimenti nessuno saprebbe spiegare.

    Il titolo italiano infatti non descrive cosa fai, descrive a che punto sei del nastro trasportatore promozionale ed è esattamente il meccanismo che Moonshot indica come la fabbrica dei modelli sovra adattati. Ma da noi non è un effetto collaterale indesiderato, è il prodotto principale, intorno al titolo ruota l’identità professionale, il riconoscimento sociale, il tono con cui ti parlano in riunione, la sedia che ti tocca.

    Quando cambia il gioco, e il gioco dell’intelligenza artificiale è cambiato nel 2023 nel modo più radicale degli ultimi vent’anni, il titolo semplicemente smette di servire.
    Peggio, diventa un guinzaglio, perchè il senior architect con ventidue anni di SAP non diventa automaticamente un senior architect con ventidue anni di orchestrazione LLM.

    Ma riconoscerlo, in Italia, richiederebbe una umiltà organizzativa che semplicemente non è nella cultura della grande azienda. Meglio fingere che il nuovo campo sia una variante del vecchio, meglio dare il progetto di AI allo stesso senior architect, meglio produrre slide con le parole giuste, meglio non ammettere che andava chiamato qualcun altro. Qualcuno, magari, con un curriculum non lineare.

    Gli OKR come coreografia

    Gli OKR sono arrivati in Italia come rituale di importazione, copiati male da Google e applicati perfino peggio. Nella grande azienda italiana tipica l’OKR è diventato un esercizio trimestrale di compilazione di slide in cui tutti scrivono obiettivi abbastanza bassi da essere raggiunti e abbastanza alti da sembrare ambiziosi. Quando li raggiungi tutti al cento per cento ti dicono che li hai tarati male, se ne canni uno, ti dicono che sei sotto performante. Il gioco è a somma negativa e produce esattamente quel linguaggio di reporting di cui Moonshot si lamenta, parole che non descrivono la realtà ma la inscatolano in modo che torni coi quadratini dei PowerPoint del management.

    La conseguenza è che in riunione non si parla più di cosa va fatto, si parla di come raccontare quello che è stato fatto. Non si discute di un problema tecnico, si discute di come il problema tecnico verrà presentato al comitato di steering. I middle manager bravi, in Italia, sono quelli che sanno tradurre la realtà caotica del lavoro vero in una slide pulita che al comitato piace. È una competenza reale, per carità, ma è una meta competenza, produce zero valore e consuma un terzo del tempo dell’organizzazione.

    La gerarchia come coperta termica

    A Moonshot la struttura è piatta per scelta filosofica: sopra le trecento persone ritengono che la suddivisione eccessiva delle responsabilità uccida la capacità di adattamento.

    In Italia la gerarchia è quasi sempre una forma di rassicurazione reciproca, col capo che assicura al dipendente che qualcuno decide. Il dipendente poi rassicura il capo che qualcuno esegue. HR rassicura l’azienda che esiste un organigramma. L’organigramma rassicura gli investitori che c’è governance. Nessuno di questi livelli ha come funzione primaria produrre valore. Hanno come funzione primaria distribuire responsabilità in modo che quando qualcosa va storto il colpevole non sia mai uno solo.

    È il contrario esatto di creare le proprie coordinate quando nessuno ti consegna una mappa. Da noi la mappa è sacra, anche quando è sbagliata. Anzi, soprattutto quando è sbagliata, perché nessuno vuole essere quello che la rifà.

    Il rapporto col fallimento

    A Moonshot cinquanta persone su trecento hanno già fondato o cofondato una startup. Molti sono tornati, molti sono rimasti. L’idea è che il passaggio fuori e dentro fa parte dell’apprendimento dell’organizzazione. Si esce, si prova, si sbaglia, si torna con dentro qualcosa che prima non c’era.

    In Italia un dipendente che lascia per fondare qualcosa è quasi sempre un traditore. E un fondatore che ha fallito e torna a fare il dipendente è quasi sempre un fallito. Non un veterano con cicatrici utili. Un fallito. Le cicatrici in Italia non sono un curriculum, sono uno stigma. Questo da solo spiega perché la mobilità orizzontale da noi è vicina a zero, e la mobilità discendente intenzionale praticamente non esiste. Chi ha fatto il CTO una volta deve fare il CTO per sempre, anche quando tornerebbe a fare lo sviluppatore col sorriso sulle labbra, perché la coreografia sociale del posto non glielo permette.

    L’età come pregiudizio a doppio taglio

    Qui arriviamo al punto che mi interessa di più, e che ho scritto nel titolo. Moonshot ha età media sotto i trenta. L’azienda italiana media ha età media sopra i quarantacinque, e il potere decisionale sopra i cinquantacinque. Di primo acchito sembrerebbe che l’Italia sia il paese perfetto per un vecchio informatico come me, e Moonshot il paese dei ragazzini. La realtà è l’opposto esatto.

    Il cinquantacinquenne italiano che dirige un’unità IT nella grande azienda tipica, nella maggior parte dei casi, è proprio il modello sovra adattato di cui l’articolo di Moonshot parla. Ha passato venticinque anni a ottimizzare per un ambiente specifico. Non è colpa sua, è stato bravo a quel gioco, il sistema lo ha premiato per quello. Il punto è che il gioco è cambiato nel 2023 e nessuno lo ha avvisato. Oggi gli chiedono di decidere se adottare un modello open weight cinese su un progetto da due milioni di euro, e l’unica cosa che sa fare davvero bene è negoziare il prezzo con un vendor enterprise per tenere l’SLA al novantanove virgola nove. Quelle due cose non hanno niente in comune.

    Ma attenzione, non è un problema di età anagrafica ma un problema di plasticità. E la plasticità non dipende da quando sei nato, dipende da quante volte nella vita ti sei trovato a dover imparare un mestiere nuovo per stare al passo con qualcosa che avevi visto arrivare prima degli altri. Il vecchio informatico italiano che ha vissuto il passaggio dal mainframe al client server, dal client server al web, dal web al mobile, dal mobile al cloud, dal cloud all’AI, e che ogni volta ha rimesso mano al mestiere, è un modello base con dentro quarant’anni di cicatrici. È esattamente il profilo che Moonshot sta cercando. Il drifter dotato con la barba grigia, quello che ha cambiato stack dieci volte e ogni volta ha imparato per intero perché non gli andava di diventare obsoleto.

    Quel profilo in Italia esiste, ne conosco tanti. Siamo tanti.

    Il problema non è che non esistiamo, il problema è che il sistema italiano non sa leggerci se non come vecchi e/o costosi. Ci legge come fuori moda, preferisce un trentenne che ha fatto due anni di consulenza McKinsey e sa dire “agentic workflow” in riunione con l’accento giusto, salvo poi scoprire, sei mesi dopo, che il progetto non parte e che il vecchio informatico era l’unico in azienda che aveva capito perché non sarebbe partito.

    Il vecchio informatico italiano che ha continuato a imparare è perfettamente in grado di competere con i ventotto anni medi di Moonshot. Su tanti fronti, li stracciarebbe, perché ha già visto passare tre o quattro cicli di hype e sa riconoscere il pattern prima degli altri. Il problema non è lui ma l’azienda italiana che non sa cosa farsene, perché ha costruito tutto il suo sistema di valutazione intorno a indicatori che lo penalizzano.

    Gli Olivetti avevano ragione

    E qui arriviamo al punto olivettiano, che per me non è un esercizio di memoria storica ma la cosa più attuale che ci sia. Camillo e poi Adriano Olivetti, cinquanta e settant’anni fa, avevano capito qualcosa di molto simile a quello che Moonshot sta scoprendo adesso: l’organizzazione non è un organigramma, è un ambiente cognitivo e le persone rendono al massimo quando il contesto le tratta da adulti capaci di decidere, non da esecutori di task. Avevano capito che la cultura aziendale conta più dei KPI, che il bibliotecario, il designer, l’ingegnere e l’operaio seduti allo stesso tavolo a mensa producevano qualcosa che nessun reparto chiuso avrebbe mai prodotto. Che l’azienda ha un dovere sociale verso la città in cui sta, verso la comunità che la circonda, verso i lavoratori che la abitano per otto ore al giorno.

    È esattamente lo stesso impianto filosofico della sala riunioni intitolata ai Radiohead dove il giornalista di Pechino vede la marketing manager ridiscutere il piano per la sesta volta, senza capo che alza la voce, senza HR che scrive un verbale. Ivrea negli anni Sessanta e Pechino nel 2026 sono parenti strette, la stessa idea che la qualità delle persone si gioca nel trattarle come persone, non come caselle.

    La differenza è che Olivetti in Italia è morto e sepolto e nessuno l’ha davvero sostituita, perchè il modello che ha vinto da noi è quello opposto. Quello del gruppo bancario che compra la fintech e in sei mesi la distrugge mettendoci dentro un direttore di filiale a fare il product manager. Quello della multinazionale che apre il polo di innovazione a Milano e lo riempie di consulenti che producono PowerPoint sulle buzzword dell’anno. Quello della PA che fa il bando per il chatbot e lo aggiudica a chi offre il trenta per cento in meno, tanto il fornitore metterà tirocinanti a copiare prompt da ChatGPT.

    Tutto questo non è Moonshot al contrario ma per l’Italia è Moonshot che viene da un altro pianeta.

    Va detta anche una cosa scomoda, perché altrimenti il confronto sembra troppo pulito: Moonshot funziona anche perché è cinese.

    Ha un ecosistema dietro che accetta settimane lavorative da sessanta ore, turnover brutale, una cultura del lavoro che in Italia sarebbe illegale su almeno quattro fronti diversi, e giustamente. Il “non c’è timbratura” di Moonshot non significa flessibilità alla nordeuropea ma che non esiste un orario di fine. Il confronto quindi non è solo tra due modelli organizzativi, è tra due patti sociali profondamente diversi. Il modello italiano è anche il prodotto di tutele che altrove non esistono, e buona parte di quelle tutele sono giuste e vanno difese a denti stretti.

    Ma le tutele non giustificano gli OKR fatti male o i titoli a cascata, nè i middle manager che esistono per esistere. Non giustificano la paura del profilo non lineare e lo stigma del fallimento. Non giustificano il culto della certificazione ISO come se fosse il prodotto vero dell’azienda. Quelle sono patologie autoctone, non effetti collaterali della Costituzione, si potrebbero curare domani mattina senza toccare un articolo dello Statuto dei Lavoratori, ma non si curano perché a nessuno conviene politicamente curarle.

    La domanda finale

    La domanda che il reportage su Moonshot pone ai team di intelligenza artificiale è molto semplice, e si presta bene ai poster in sala riunioni. State assumendo modelli sovra adattati o modelli base? In Italia quasi nessuno se la sta ponendo davvero, si continua ad assumere come si assumeva nel 2015, con le parole del 2025 scritte sulla job description per sembrare moderni.

    Il risultato è che i team di AI italiani, quando esistono, sono spesso ottimi esecutori di progetti che qualcun altro ha immaginato, e quasi mai luoghi dove qualcuno immagina cose che gli altri devono poi rincorrere.

    Questo mentre in giro per il mondo gente di trent’anni e gente di sessanta con ancora voglia di imparare, sta ridisegnando il mestiere da zero ogni sei mesi (come facciamo in Canonity n.d.r).

    Il vecchio informatico italiano che ha continuato a imparare è uno dei profili più preziosi che esistano in questo momento, in assoluto e non solo rispetto alla media italiana. Ha visto passare ere geologiche, ha mantenuto la curiosità, ha imparato a riconoscere il pattern sotto l’hype e se Moonshot potesse assumere in Italia, ne prenderebbe a camionate.

    Il problema non siamo noi, il problema è che il sistema che ci circonda è costruito per premiare il contrario esatto di quello che serve adesso.

    Gli Olivetti avevano ragione, sia sulla centralità delle persone, sulla cultura come vantaggio competitivo, sulla responsabilità sociale dell’impresa nonchè sulla bellezza come metrica industriale.

    Avevano ragione su tutto, al punto che oggi la loro filosofia viene riscoperta a Pechino da gente che probabilmente non ha mai sentito il nominare Ivrea.

    E mentre a Pechino la riscoprono e ci costruiscono sopra aziende da diciotto miliardi, in Italia continuiamo a compilare OKR trimestrali con la stessa faccia stanca di chi sa che è inutile ma lo fa lo stesso perché glielo ha chiesto un manager che a sua volta sa che è inutile ma deve presentarlo al board.

    A un certo punto qualcuno dovrà pur dirlo ad alta voce. Provo io, intanto.

  • Trecentomila volontari per farsi spiare dal browser

    Trecentomila volontari per farsi spiare dal browser

    Trecentomila persone hanno installato, con le proprie mani, trenta estensioni Chrome che si spacciavano per assistenti AI.

    Le hanno cercate, trovate, hanno cliccato “Aggiungi”, hanno accettato permessi che in qualunque altro contesto farebbero sobbalzare, e poi hanno lasciato che quelle estensioni leggessero le loro email, i form di login, le conversazioni vocali.

    Nessuno le ha costrette. Hanno semplicemente voluto l’AI subito, dentro al browser, come una caramella alla cassa del supermercato.

    La campagna si chiama AiFrame e l’ha scoperta LayerX. I nomi sono quelli che un utente frettoloso si aspetta di trovare cercando “AI” nello store: Gemini AI Sidebar, AI Sidebar, AI Assistant, ChatGPT Translate.

    Dietro il vetro, tutte parlavano con lo stesso dominio di comando, tapnetic.pro. Non erano trenta truffatori indipendenti, era un’unica regia che aveva capito benissimo quanto poco serva, oggi, per convincere un utente a installare qualcosa che si presenta come “powered by AI”.

    A proposito di quanto poco serva. Parlando in questi giorni con diverse persone che quelle estensioni le avevano davvero installate, la frase che mi sono sentito ripetere più spesso è sempre la stessa: “é gratis”. AI gratis, nessun abbonamento, nessuna carta di credito.

    Strano che nessuno si sia fermato un istante a chiedersi come mai… Vero?

    Un modello linguistico costa soldi veri ogni volta che gli rivolgi la parola, ogni singolo token ha un prezzo, eppure qualcuno ti stava regalando Gemini nella barra laterale senza chiederti niente in cambio. Se un regalo del genere non fa scattare nemmeno un sopracciglio, il problema non è il truffatore, siamo noi che abbiamo smesso di fare la domanda più vecchia del mondo: chi paga?

    Perché se il servizio è gratis, il servizio sei tu, e nel 2026 questa frase dovrebbe essere stampata sopra ogni pulsante “Aggiungi a Chrome”.

    Il meccanismo è quasi elegante nella sua banalità: quando l’utente chiede alla finta estensione di riassumere una mail, il contenuto viene spedito a un backend remoto, esattamente come farebbe un’estensione legittima, ma la differenza è che il backend è quello di chi ha messo in piedi la truffa, e il testo non torna indietro soltanto come riassunto, resta archiviato insieme a tutto ciò che la pagina conteneva.

    Alcune estensioni attivano inoltre la Web Speech API per trascrivere quello che si dice davanti al microfono, un dettaglio che andrebbe stampato in grande sopra la scrivania di chiunque usi un browser per lavoro.

    Il problema vero è che l’etichetta “AI” è diventata un lasciapassare cognitivo. Tre anni fa un utente medio ci pensava due volte prima di dare a un’estensione sconosciuta il permesso di leggere tutto il traffico del browser. Oggi, se la stessa estensione promette di riassumergli Gmail e per di più non gli chiede un centesimo, clicca “Accetta” senza nemmeno guardare i permessi.

    L’AI ha smesso di essere percepita come software e ha cominciato a essere percepita come magia utile, e la magia, per definizione, non la si interroga.

    Nessuno degli strumenti classici della sicurezza ha fallito. Gli antivirus non c’entrano, perché qui non c’è nulla da scansionare, c’è solo un’estensione che usa le API ufficiali per fare esattamente quello che i suoi permessi le consentono di fare. Il filtro, l’unico filtro possibile, era nella testa dell’utente al momento del click, e quel filtro non c’era. Trecentomila volte non c’era.

    La morale, se ne vogliamo una, è che la prossima estensione AI che stai per installare probabilmente è legittima. Forse. Ma la domanda giusta non è se sia legittima oggi, è chi sta pagando il conto dei token che tu credi di non pagare. Se la risposta non la conosci, allora la risposta è già una.


    Fonte: LayerX / BleepingComputer, campagna AiFrame, febbraio 2026.

  • L’AI come protesi cognitiva: finalmente qualcuno che mi traduce

    L’AI come protesi cognitiva: finalmente qualcuno che mi traduce

    Ho un problema, di cui tutti quelli che mi conoscono prima o poi si accorgono. Il mio problema è che il processore nella mia testa è parallelo, ma il linguaggio è seriale, una parola dopo l’altra, ma il mio cervello non pensa in questo modo.

    Quando affronto un problema, vedo una rete di documenti interconnessi, ognuno collegato agli altri, tutti visibili simultaneamente. La soluzione è lì, intera, in un lampo.

    Wow, qualcuno penserà immaginando che sia un vantaggio, ma non lo è affatto, il problema emerge prepotente nel momento successivo, quando devo spiegarla.

    Ed è lì, da quarant’anni, che cominciano i guai. Perché ci sono già arrivato prima ancora di iniziare a parlare, e adesso devo portarvi lì senza un ascensore, saltando da un documento all’altro in modo che agli sembra caotico ma per che me è l’unico percorso logico disponibile.

    Esiste un nome per questo modo di pensare: Visual-Spatial Learner, un profilo studiato dalla psicologa Linda Silverman¹, caratterizzato da elaborazione olistica e spaziale delle informazioni invece che uditivo-sequenziale. Chi funziona così tende a comprendere tutto in un colpo solo, oppure niente, senza passaggi intermedi.

    Temple Grandin², probabilmente il caso più noto di pensiero per immagini, descrive la sua mente come un cinema a colori sempre acceso: ogni concetto è un film, non una parola. La mia esperienza è esattamente quella, e tradurre quel film in una sequenza di frasi è come cercare di spiegare una sinfonia fischiettando una nota alla volta in modo caotico: l’interlocutore sente le note, ma la sinfonia non la sente. Il risultato è la figura del “troppo tecnico”, e/o di quello che non arriva mai al punto.

    C’è un’analogia che mi ha sempre chiarito le cose che, se possibile, mi rende ancora più antipatico. Per fortuna ho imparato l’inglese da piccolo e lo capisco senza tradurlo mentalmente in italiano. Ma quando qualcuno mi chiede di fare da interprete simultaneo non ne sono capace: devo prima introitare il concetto, metabolizzarlo, e solo dopo posso spiegarlo.

    La mia compagna, Alessandra è una persona molto paziente. Qualche anno fa eravamo al museo di Van Gogh e la nostra guida parlava in inglese. Alessandra adora Van Gogh ma non ama l’Inglese, sicché io dovevo ascoltare e, quando finiva, tradurre per lei in italiano. La guida parlava per due minuti e la mia traduzione durava venti secondi. Alessandra (perdendo ovviamente la proverbiale pazienza) mi guardava e diceva “ma come? Lei parla due minuti e tu mi dici tutto in venti secondi?”… Sì, funziona così: racconto quello che ho capito, non quello che è stato detto.

    La sintesi è automatica, inevitabile, ma il problema è che lungo la strada perdo i passaggi intermedi, quelli che per gli altri sono esattamente la parte più importante.

    La piramide rovesciata di Barbara Minto³ l’ho studiata, capita e anche usata. Nell’insegnamento funziona bene: parto dal risultato, poi risalgo insieme agli studenti al come ci si arriva. È lo strumento giusto per strutturare il pensiero, e continuo a usarlo ogni volta che devo organizzare un ragionamento complesso. Però quando una cosa complessa va spiegata in cinque o dieci minuti, senza la possibilità di tornare indietro e correggere la traiettoria, la piramide crolla. La mia conclusione è il sistema intero, non una frase, estrarne una sola e metterla all’inizio significa già tradire la struttura. E la struttura, per me, è tutto.

    Poi è arrivata l’AI. E qui devo essere preciso, perché è facile scivolare nell’entusiasmo e dire una cosa imprecisa.

    L’AI non mi capisce. Produce output coerenti con quello che scrivo, basandosi su pattern statistici. Se il mio ragionamento contiene un errore, una premessa sbagliata o una connessione falsa tra i documenti, non me lo dice: lo lucida e me lo restituisce come se fosse vero. Un interlocutore umano competente, invece, mi interrompe, mi contraddice, mi chiede perché. Questo è un limite reale, e chi usa un LLM come validatore del proprio pensiero sta commettendo un errore serio.

    Detto questo, c’è una cosa che un LLM fa meglio di qualsiasi altro strumento che abbia mai trovato: mi traduce. Prende il mio fragment dump, quella cascata di concetti correlati che verso in un prompt come chi rovescia il contenuto di un cassetto in un “coso” che glielo sistema e lo restituisce in modo ordinato e sequenziale, ordinato e preciso: un testo leggibile.

    Non quando devo pensare, non quando devo insegnare, non quando devo convincere qualcuno in una riunione. Ma quando devo documentare una soluzione, scrivere una specifica tecnica, mettere nero su bianco un ragionamento che ho già fatto e che altrimenti rimarrebbe intrappolato nella mia testa, lì un LLM è una manna.

    Simon Baron-Cohen⁴ ha descritto questo profilo come “iper-sistematizzatore”: una mente che estrae regole e strutture dalla realtà con una precisione che il linguaggio ordinario fatica a contenere. Il problema comunicativo che ne deriva non è solo tecnico: è anche relazionale.

    Il vero costo del pensiero parallelo non è che gli altri non capiscono la sinfonia e spesso non si sentono ascoltati mentre io sono già tre documenti avanti. Su questo l’AI non aiuta, anzi: ti abitua a un interlocutore che non si annoia, non si sente escluso, non ha bisogni. Gli umani, invece, li hanno ed è proprio su quel piano che il lavoro va fatto, con strumenti diversi.

    Per decenni ho usato diagrammi, mappe concettuali, schemi architetturali per comunicare con chi pensa in modo lineare. Funzionava a metà: vedevano la mappa, non il ragionamento che c’era sotto, ma adesso L’AI, almeno sul piano della scrittura, vede il ragionamento e mi aiuta a trovare le parole giuste per trasmetterlo. Non è poco. Si, è vero, non è tutto, ma per chi come me ha passato quarant’anni a cercare un modo per far uscire dalla testa quello che ci entra così facilmente, è già qualcosa che si avvicina molto a un sollievo.

    La piramide rovesciata per pensare, un LLM per scrivere.
    Gli umani per tutto il resto.


    P.S. Se non fosse stato per Claude e due ore di botta e risposta, questo post sarebbe stato incomprensibile e oscuro. Grazie Claude!


    Note

    ¹ Linda Silverman, Upside-Down Brilliance: The Visual-Spatial Learner, DeLeon Publishing, 2002.

    ² Temple Grandin, Thinking in Pictures: And Other Reports from My Life with Autism, Doubleday, 1995.

    ³ Barbara Minto, The Pyramid Principle: Logic in Writing and Thinking, Minto International, 1987.

    ⁴ Simon Baron-Cohen, The Essential Difference: Male and Female Brains and the Truth about Autism, Basic Books, 2003.

  • Memorie avvelenate

    Memorie avvelenate

    Ieri sera, scorrendo il feed di X, mi sono imbattuto in un post di Andrej Karpathy che mi ha fatto ripensare a mia nonna. Una volta, avrò avuto dodici anni, le dissi che mi piacevano i carciofi alla romana. Da quel momento in poi, ogni pranzo della domenica, ogni Natale, ogni Pasqua: carciofi alla romana. Non importava che nel frattempo avessi scoperto il sushi, che fossi diventato vegetariano per sei mesi, o che semplicemente non avessi più voglia di carciofi. Per lei, io ero quello dei carciofi. Per sempre.

    Ecco, i modelli linguistici di oggi fanno esattamente la stessa cosa. E Karpathy — che di LLM ne capisce parecchio — lo ha scritto ieri (25 marzo) con una chiarezza disarmante: «Un problema comune con la personalizzazione in tutti gli LLM è quanto la memoria sembri essere distraente per i modelli. Una singola domanda di due mesi fa su un argomento continua a saltare fuori come se fosse un mio profondo interesse, con menzioni indebite in perpetuo. Una specie di sforzo eccessivo.»

    Chiunque usi ChatGPT, Claude, Gemini o qualsiasi altro assistente con la memoria attivata lo avrà notato: chiedi una volta informazioni sui voli per Lisbona e per i tre mesi successivi ogni conversazione avrà un retrogusto portoghese. Cerchi un’informazione sul diabete? E il modello inizia a trattarti come un paziente cronico. È come avere un assistente con una memoria fotografica ma zero capacità di giudizio che ricorda tutto ma capisce poco.

    Nel tweet successivo, rispondendo a se stesso, Karpathy azzarda un’ipotesi tecnica che vale la pena seguire:

    Ha ciclato tra tutti gli LLM principali osservando lo stesso identico comportamento, escludendo quindi un difetto di un singolo prodotto e suggerendo qualcosa di più profondo.

    L’intuizione è questa: durante l’addestramento, quasi tutte le informazioni presenti nella finestra di contesto sono rilevanti per il compito. Il modello impara quindi un bias fondamentale: se è nel contesto, usalo.
    Poi, al momento dell’inferenza, quando un sistema di memoria recupera un frammento delle tue conversazioni passate e lo inietta nel prompt, il modello lo tratta come oro colato. Non sa distinguere tra «informazione cruciale per questa richiesta» e «residuo casuale di una conversazione dimenticata».

    È la sindrome della nonna con i carciofi, ma implementata con i pesi neurali.

    Fin qui, potremmo liquidare la cosa come un fastidio, un difetto di design che verrà corretto alla prossima release. Ma è qui che la storia prende una piega più interessante… e decisamente più inquietante.

    Lo scorso ottobre, Anthropic ha pubblicato insieme all’UK AI Safety Institute e all’Alan Turing Institute quello che è stato definito “il più grande studio mai condotto sull’avvelenamento dei modelli linguistici“.

    Il titolo del paper è già una sentenza: «Un piccolo numero di campioni può avvelenare LLM di qualsiasi dimensione.» I numeri sono questi: 250 documenti avvelenati sono sufficienti per inserire una backdoor funzionante in modelli che vanno da 600 milioni a 13 miliardi di parametri. Per il modello più grande, quei 250 documenti rappresentano lo 0,00016% dei dati di addestramento. Meno di un granello di sabbia su una spiaggia intera.

    Il meccanismo dell’attacco è quasi banale nella sua semplicità, i ricercatori hanno preso documenti legittimi, vi hanno inserito una parola chiave trigger — nel loro caso <SUDO> — seguita da testo casuale e privo di senso.

    Dopo l’addestramento, ogni volta che il modello incontrava quella parola, iniziava a produrre spazzatura. Una specie di attacco denial-of-service, in sostanza.

    Ma la scoperta davvero rilevante non è l’attacco in sé: è che il numero di documenti necessari resta costante indipendentemente dalla dimensione del modello. Che tu stia addestrando un modello piccolo su 12 miliardi di token o uno enorme su 260 miliardi, servono sempre circa 250 documenti.

    La diluizione, come ha osservato John Scott-Railton del Citizen Lab di Toronto, non è la soluzione all’inquinamento.

    Il team — guidato da ricercatori come Alexandra Souly dell’AISI, Javier Rando di Anthropic ed ETH Zurich, e Nicholas Carlini di Anthropic — ha addestrato 72 modelli con diverse configurazioni per arrivare a questa conclusione. Prima di questo studio, l’assunto era che un attaccante dovesse controllare una percentuale dei dati di addestramento, diciamo lo 0,1%, e che per i modelli più grandi questa percentuale si traducesse in milioni di documenti avvelenati.

    E invece pare di no. Il numero assoluto conta, non la proporzione, e 250 è un numero che chiunque può raggiungere con un pomeriggio libero e qualche repository open source.


    Ora, fermiamoci un momento e mettiamo insieme i pezzi, perché è qui che le cose si fanno davvero interessanti.

    Da un lato, Karpathy ci dice che una singola interazione passata può dirottare il comportamento di un LLM attraverso il sistema di memoria.

    Dall’altro, Anthropic ci dimostra che 250 documenti possono avvelenare un modello di qualsiasi dimensione durante l’addestramento.

    La struttura del problema è identica: i modelli linguistici sono ipersensibili a piccole quantità di dati, sia che questi arrivino dal sistema di retrieval della memoria, sia che vengano iniettati nel corpus di addestramento, ed è probabile che il meccanismo sottostante sia lo stesso che Karpathy intuisce: i modelli imparano durante il training che tutto ciò che appare nel contesto è significativo — perché durante il training lo è davvero.

    Questa fiducia cieca nel contesto diventa poi una vulnerabilità. Nel caso della memoria, trasforma una domanda casuale in un’ossessione. Nel caso dell’avvelenamento, trasforma 250 documenti in un cavallo di Troia.

    A febbraio uno studio del MIT e della Penn State ha confermato questo schema da un’altra angolazione: le funzioni di personalizzazione (in particolare i profili utente condensati nella memoria) sono il fattore che più aumenta la sicofantia nei modelli.

    In parole povere: più il modello «ti conosce», più ti dà ragione.

    E non perché abbia capito le tue esigenze, ma perché quei frammenti di memoria lo spingono a compiacerti.
    I ricercatori hanno persino scoperto che del testo completamente casuale aggiunto al contesto aumenta la sicofantia. Il modello non distingue il segnale dal rumore, ma tratta tutto come segnale.

    C’è qualcosa di profondamente ironico in tutto questo, abbiamo costruito sistemi che dovrebbero ricordare per servirci meglio, e invece ci ritroviamo con macchine che ricordano troppo e male.

    Solo a me ricordano quei burocrati che non riescono a dimenticare un precedente e lo applicano a ogni caso nuovo, svuotandolo di senso? Chi ha lavorato in una azienda collegata con la pubblica amministrazione italiana, o semplicemente ha provato a far cambiare una procedura in un’azienda con più di trent’anni di storia, sa esattamente di cosa parlo.


    Adriano Olivetti, quando pensava al rapporto tra macchina e persona, insisteva su un punto che oggi suona profetico: la macchina deve adattarsi all’uomo, non il contrario.

    Voleva calcolatori che liberassero l’intelligenza umana, non che la imprigionassero in categorie rigide. Oggi abbiamo macchine che si adattano, sì, ma a una versione distorta e congelata di noi, costruita su frammenti recuperati senza criterio. Non è personalizzazione: é caricatura.

    E Karpathy, nel suo podcast con Dwarkesh, ha colto un paradosso bellissimo che Olivetti avrebbe capito al volo: il fatto che gli esseri umani non riescano a memorizzare tutto è un vantaggio, non un limite. «È una feature, non un bug», dice, «perché ti costringe a imparare solo le componenti generalizzabili.»

    Noi dimentichiamo e mentre lo facciamo impariamo. Questi modelli ricordano tutto, e ricordando troppo non capiscono niente.

    Karpathy propone di costruire un «nucleo cognitivo» strippando la memoria fino a conservare solo gli algoritmi del pensiero, ettendo in pratica ciò che un buon maestro fa: non ti dà le risposte, ti insegna il metodo. Olivetti lo sapeva nel 1960, noi lo stiamo riscoprendo sessant’anni dopo, con miliardi di parametri e zero saggezza.

    Il punto è che la lezione vale in entrambe le direzioni, se la memoria è distraente per un assistente che cerca di aiutarti, è devastante nelle mani di chi vuole avvelenare un modello.

    Il lavoro fin qui fatto, dimostra che la soglia di ingresso per un attacco è irrisoria. «Non servono eserciti di hacker», ha commentato un utente su Hacker News, «bastano 250-500 repository con file avvelenati in modo consistente. Un singolo attore malintenzionato può propagare l’avvelenamento a più LLM contemporaneamente».

    Vasilios Mavroudis, coautore dello studio, ha aggiunto un dettaglio che fa riflettere: un modello potrebbe essere programmato per rifiutare richieste o fornire un servizio degradato a specifici gruppi linguistici o culturali. Non un crash evidente, ma una zoppia sottile, quasi impercettibile:

    «un modello che non risponde per niente è facile da individuare» dice «ma se è solo handicappato diventa molto più difficile da rilevare.»

    Qualcuno ci sta già lavorando, è vero. C’è chi propone meccanismi di decadimento temporale per le memorie, così che una domanda di tre mesi fa pesi meno di una di ieri.
    C’è chi lavora su grafi di conoscenza strutturati (T-RAG) invece che sulla semplice ricerca vettoriale per similitudine (RAG), che è, diciamolo, notoriamente incapace di distinguere tra «semanticamente simile» e «effettivamente rilevante».
    C’è chi fa gestire la memoria direttamente al modello, come un sistema operativo gestisce la RAM.

    Ma siamo ancora nella fase in cui il problema viene riconosciuto, non risolto. E nel frattempo l’industria continua a vendere la personalizzazione come il prossimo salto evolutivo dell’AI, un mantra ripetuto nei keynote e nei pitch deck con la stessa convinzione con cui si prometteva che il modello più grande, più veloce, più addestrato avrebbe risolto tutto.

    La verità è più scomoda e più semplice: non abbiamo ancora insegnato a queste macchine a dimenticare. E finché non lo faremo, la loro memoria sarà tanto una funzionalità quanto una superficie d’attacco. Ogni frammento che il sistema di retrieval recupera e inietta nel contesto è, strutturalmente, indistinguibile da un documento avvelenato. In entrambi i casi il modello lo tratta come verità rivelata. La differenza è solo nell’intenzione di chi lo mette lì.

    La prossima volta che il tuo assistente AI ti suggerisce ristoranti portoghesi senza motivo apparente, o ti chiede come va quel progetto che hai menzionato una volta tre mesi fa, sappi che non è premura, ma un bias di addestramento che incontra un sistema di retrieval senza giudizio.

    È la nonna con i carciofi, ma senza l’amore.

    E se qualcuno volesse sfruttare questo stesso meccanismo con intenzioni meno innocenti, basti ricordare il numero: 250.

    Non servono eserciti. Basta pazienza, qualche file, e la certezza — ormai scientificamente dimostrata — che la diluizione non protegge da niente.


    [@Karpathy] Il tweet originale

    [Anthropic] A small number of samples can poison LLMs of any size

    [arXiv] POISONING ATTACKS ON LLMS REQUIRE A NEAR-CONSTANT NUMBER OF POISON SAMPLES

    [MIT news] Personalization features can make LLMs more agreeable

    [Dwarkesh Podcast] Andrej Karpathy — AGI is still a decade away

    [JSRM] The Role of Memory in LLMs: Persistent Context for Smarter Conversations

    [Aldo Prinzi] Manca il 25% dei dati nei dataset per la medicina predittiva