Categoria: Intelligenza Artificiale

  • Quando l’AI smette di indovinare e inizia a certificare

    Quando l’AI smette di indovinare e inizia a certificare

    Conosci Perplexity (perplexity.ai)? Se la risposta è no, allora dovresti.

    Perplexity è brillante!

    Se lo usi per lavoro, la scena è questa: fai una domanda, in pochi secondi arriva una risposta fluida, ben scritta, piena di riferimenti. Ed é tutto perfetto…

    Perplexity, rispetto ai soliti chatbot, ha una marcia in più: orchestra più LLM, sceglie (o prova a scegliere) il modello più adatto, collega fonti diverse.

    È un ottimo laboratorio di idee. Ma è un laboratorio senza registro di laboratorio: non sai quali modelli ha usato, in che ordine, con quali criteri. E soprattutto non hai un modo semplice per rifare lo stesso percorso tra un mese, o farlo rifare a un collega, ed ottenere un risultato costante e ripetibile.

    Allo scoccare del quarto anno di GenAi, la domanda oggi è: “quanto costa il fatto di non poter certificare il processo che ha portato a quella risposta?”.


    Perplessità e canonicità: due facce della stessa storia

    La scienza vive da sempre su una tensione fra due poli.

    Da una parte c’è la perplessità: il dubbio, le ipotesi, la curiosità che apre piste nuove. È la fase in cui Perplexity è fortissimo: ti mostra fonti diverse, prospettive in conflitto, ti fa vedere che “forse qui qualcosa non torna”.

    Dall’altra c’è la canonicità: quello che diventa metodo, protocollo, standard. Non è la verità assoluta, ma un “con questo protocollo, su questi dati, arriviamo a questa conclusione, con questo grado di confidenza. Sempre”.

    In questo schema, Perplexity è il motore della domanda. Manca però il motore del metodo.

    Se sei un professionista non puoi chiedere ad un unico modello di “fare tutto”, ma hai la necessità di costruire una piccola squadra di modelli, ognuno con un ruolo preciso, legati da un flusso che puoi spiegare e rifare.


    Non sono il solo a sostenerlo, qualche tempo fa Andrej Karpathy ha scritto che il futuro non è il prompt engineering, ma la context engineering: riempire la finestra di contesto con le informazioni giuste, nello step giusto, per il modello giusto.

    Karpathy, la “context engineering” e il terzo pilastro

    Le applicazioni serie di LLM, dice, non sono “un’interfaccia carina sopra un modello”, ma software veri, con flussi di controllo, chiamate orchestrate, memoria, strumenti, verifiche.

    È esattamente quello che ho chiamato pipeline prompting nel mio manifesto:
    – prima la scomposizione in step;
    – poi la specializzazione dei modelli per compito;
    – infine il filo di continuità, cioè come il contesto passa da uno step all’altro.


    Canonity: dai prompt ai protocolli

    Quale nome dare all’editor dove prende forma il pipeline prompting?.

    Canonity.

    Non è il posto dove “parli con l’AI”: è il posto dove decidi come le AI devono lavorare fra loro su un problema reale.

    Canonity nasce esattamente qui: non come “un altro chatbot”, ma come editor visivo di step-prompt.

    Invece di un mega-prompt che speri venga interpretato bene, costruisci un workflow:

    • uno step scompone la domanda in sotto-problemi;
    • un altro cerca, ma restituisce solo metadati strutturati (DOI, anno, tipo di studio…);
    • un terzo valuta la qualità degli studi e segnala bias;
    • un quarto sintetizza, usando solo le fonti che superano una certa soglia;
    • alla fine ci sei tu, che controlli, correggi, approvi.

    Ogni passaggio è esplicito, ogni modello fa il pezzo di lavoro per cui è più adatto, il flusso ha un ID, una versione, una storia.

    Non stai più “giocando al prompt perfetto”: stai scrivendo un protocollo che altri possono usare, criticare, migliorare e4 che da risultati ripetibili ad ogni esecuzione.


    Perché “Canonity” richiama “Perplexity”, ma fa un mestiere diverso

    Il gioco di nomi è ovvio.

    Perplexity richiama la perplessità, il dubbio fertile, l’esplorazione. È perfetto quando vuoi generare idee, esplorare lo spazio di possibilità, farti sorprendere.

    Canonity richiama il canone: ciò che diventa riferimento, metodo, standard. Entra in gioco quando devi dire: “Questo è il modo in cui abbiamo affrontato il problema; questi sono gli step, i modelli, le fonti escluse e perché”.

    Se fai ricerca, se lavori in sanità, in ambito legale, in policy pubblica, non ti basta “me l’ha detto l’AI”. Hai bisogno di una catena di custodia dell’informazione. È questo il passaggio: dall’AI-oracolo all’AI-strumento scientifico.

    Adottare uno strumento come Canonity significa cambiare ruolo: da utente di AI a orchestratore di AI, da prompter a tenmpo perso a professionista: non vendi più “prompt” o “ore di chat”, ma processi: come definisci il problema, come scomponi il lavoro, quali modelli usi, quali controlli applichi.


    E adesso?

    Canonity è in sviluppo attivo e lo stiamo testando con chi ha questo problema molto concreto: non gli basta più una risposta brillante, vuole un metodo che possa difendere davanti a un revisore, un cliente, un comitato etico.

    Se sei uno dei 22 milioni di utilizzatori (o meglio uno degli 8 milioni di utilizzatori a pagamento) di Perplexity e senti che ti manca il “registro di laboratorio”, tieni d’occhio quello che succede intorno a Canonity e al pipeline prompting.

    Perché la partita, ormai, non è più “chi ha il modello più intelligente”, ma chi ha il processo più trasparente e ripetibile.

  • Prompter: il lavoro che cresce mentre altri calano

    Prompter: il lavoro che cresce mentre altri calano

    (dati e stime 12–24 mesi)

    Negli ultimi due anni la GenAI ha spostato gli equilibri del lavoro online e non è un’impressione.
    Su una “grande piattaforma freelance” (nello studio non è indicata quale) dopo l’arrivo di ChatGPT e dei generatori d’immagine, i cluster più esposti all’automazione hanno registrato cali netti degli annunci.

    In particolare:

    • scrittura (≈ −30%),
    • software/app/web (≈ −21%),
    • alcune aree dell’ingegneria (≈ −10%),
    • graphic design (≈ −18%)
    • 3D (≈ −16%).

    Al contrario, aumentano gli annunci che citano esplicitamente la skill “ChatGPT”. È la spia di un nuovo mestiere: prompter (o, più precisamente, AI orchestrator).

    Questa dinamica non racconta “meno lavoro in assoluto”, ma un cambio di mix: i task ripetitivi (bozze di testi, codice standard, grafica base) vengono svolti in autonomia con LLM; resta e cresce la parte di definizione del problema, prompt design a step, orchestrazione di modelli e strumenti, validazione e integrazione nei processi reali (API, dati, governance).

    Cosa sta succedendo

    I dati mostrano chiaramente la cannibalizzazione dei compiti ripetitivi in scrittura, sviluppo e grafica, e l’emersione di attività più complesse dove il prompter è protagonista. Se anche una parte del lavoro “perso” si ricompone in regia AI esternalizzata, nei prossimi 12–24 mesi avremo migliaia di opportunità strutturate attorno a prompt design, QA e integrazione.

    1. Sostituzione del ripetitivo
      Molte micro-attività vengono internalizzate via prompt: da “Cerco freelance per X” a “Risolvo X con un LLM”. Questo spiega la contrazione degli annunci nei cluster più esposti.
    2. Ricomposizione verso la complessità
      I job che restano chiedono più ampiezza (più skill per annuncio) e profondità (problemi meno standardizzabili). La domanda si sposta dall’esecuzione all’orchestrazione.
    3. Emergenza del profilo “prompter”
      Crescono gli annunci che richiedono esplicitamente competenze in ChatGPT/LLM: segnale che la regia dell’AI diventa un servizio a sé, con responsabilità su qualità, sicurezza e integrazione.

    Quanti prompter serviranno? (stima prudente)

    Usando i volumi medi settimanali della piattaforma e i cali differenziali osservati, il “vuoto” creato dalla GenAI equivale a circa 1.700+ annunci a settimana che prima erano tradizionali e oggi vengono automatizzati o riassemblati.

    Se fra il 5% e il 25% di queste attività viene esternalizzato come prompting/orchestrazione, parliamo di ~86–430 nuovi post/settimana, cioè ~4,5k–22k all’anno, per arrivare a ~9–45k in 24 mesi.

    Non è una profezia: è una ipotesi ragionata coerente con l’aumento di annunci che citano “ChatGPT” e con l’evoluzione dei brief verso outcome e integrazioni.

    Cosa cambia per professionisti e aziende

    Per i professionisti

    serve salire di livello. Non vendere “ore di esecuzione”, ma outcome + orchestrazione: scoping, design di prompt multistep, scelta del modello per compito, controlli di qualità (factuality, stile, copyright), integrazione in pipeline (dati, API, RPA), reportistica e metriche.
    La verticalizzazione (legale, sanità, e-commerce) moltiplica il valore perché unisce AI a dominio e compliance.

    Per le aziende

    internalizzare dove l’attività è core; esternalizzare la regia se mancano competenze e tempo. Scrivere brief orientati a risultati, pretendere trasparenza di processo (step, controlli, dati usati), definire policy su privacy, copyright e bias. Il ritorno maggiore non viene dal “provare l’AI”, ma dal industrializzare i flussi.


    Quali strumenti servono?

    La domanda non è se il ruolo crescerà, ma chi saprà passare dalla demo al delivery con strumenti, metodi e metriche all’altezza.

    Serve quindi uno strumento operativo che traduca obiettivi di business in pipeline AI governabili: editor visuale multi-LLM a step, versioning, QA automatico, tracciamento metriche, governance/compliance, e — quando serve — un mercato per acquistare risultati, non prompt nudi.

  • Prompt framework: cosa sono e come usarli

    Prompt framework: cosa sono e come usarli

    Come avrai notato dalla marea di articoli e spiegazioni che circolano, l’intelligenza artificiale è spesso percepita come una specie di magia. Ma tu mi segui, e sai che dietro c’è tecnologia; e dove c’è tecnologia, ci sono metodi.

    Molti descrivono la tecnica del prompting come qualcosa di banale: digiti “fammi X” e l’AI risponde… Bello, vero? È quello che hai fatto finora? Se è così, sai bene che generando un testo da un prompt, il risultato cambia ogni volta, è impreciso, e serve tempo per trovare la formula giusta. Hanno anche inventato il termine “allucinazioni” per descrivere i “bug”.

    Ma te (e ai tuoi futuri clienti) servono risultati coerenti, ripetibili e di qualità professionale, per questo motivo a maggio del 2025 ho spiegato più di 15 tecniche nel mio libro tradotto in 4 lingue (QUI).

    Nella mia visione, la figura del “prompter” diventerà sempre più importante. Dunque, è fondamentale avere padronanza delle metodologie di interrogazione degli LLM: sarà certamente una delle competenze più richieste nel prossimo futuro.

    Oggi, a distanza di soli 6 mesi (che nel campo dell’IA equivalgono a un’epoca geologica), quelle tecniche sono state sintetizzate, o “compattate”, in sette veri e propri framework di prompt (tecniche/metodologie d’uso).

    In questo articolo ti accompagnerò passo passo, usando un unico esempio che complicheremo gradualmente, man mano che saliamo di livello.

    Caso unico per tutti gli esempi
    Scrivere una scheda prodotto per e-commerce del “Kit serratura baule Vespa (cod. 299676)”.
    Obiettivo: testo chiaro, orientato alla vendita, con compatibilità e CTA.

    PAM > Action > Monitor

    Quando usarlo: è il più semplice, usalo per iniziare subito e migliorare un output grezzo. In pratica iteri più volte fino ad arrivare all’obiettivo.

    Prompt > (leggi la risposta) > Monitor/Modify: [cosa cambi e perché]

    Esempio 1

    Prompt v1: “Scrivi una scheda prodotto per il kit serratura baule Vespa 299676.”
    Modify: “Riduci a 120–150 parole e inserisci una CTA finale.”

    Perché funziona: ti fa iterare subito, senza teoria, ma il risultato può essere abbastanza deludente.

    Stiamo usando una AI, proviamo a chiedergli qualcosa in più:

    SMART — Specific, Measurable, Achievable, Relevant, Time-bound

    Quando usarlo: per definire criteri misurabili e dire con chiarezza quando il testo è completo.

    Obiettivo SMART: [S][M][A][R][T] + criteri di accettazione

    Esempio 2

    Obiettivo SMART: 120–150 parole, leggibilità ≥60 (Flesch IT),
    1 riga di beneficio iniziale, 3 bullet (compatibilità, installazione, garanzia), chiusura con CTA unica (“Aggiungi al carrello”).

    RACE — Role, Action, Context, Execute

    Quando usarlo: per dare ruolo, compito, contesto e formato.
    Effetto: cala la variabilità di tono e struttura.

    Role: [chi sei]
    Action: [cosa devi fare]
    Context: [per chi, vincoli, USP]
    Execute: [formato, stile, lunghezza]

    Esempio 3

    Role: Copywriter e-commerce aftermarket scooter.
    Action: Scrivi la scheda prodotto del kit serratura baule Vespa 299676.
    Context: Target fai-da-te; evidenzia compatibilità e installazione semplice.
    Execute: 120–150 parole; apertura con beneficio; 3 bullet (compatibilità, installazione, garanzia);
    chiusura con CTA “Aggiungi al carrello”.

    TRACE — Task, Role, Audience, Context, Example

    Quando usarlo: quando il pubblico conta e vuoi un esempio guida per allineare stile e lessico.

    Task: [output]
    Role: [persona]
    Audience: [per chi]
    Context: [scenario, vincoli]
    Example: [mini-esempio di tono/struttura]

    Esempio 4

    Task: Scheda prodotto e-commerce.
    Role: Copywriter tecnico.
    Audience: Proprietari Vespa ET2/ET4/Liberty senza esperienza meccanica.
    Context: Ricambio originale, modelli compatibili, istruzioni base.
    Example (tono): “Compatibile con Vespa ET2/ET4. Si installa in pochi minuti con gli attrezzi di base. Garanzia 24 mesi.”

    CO-STAR — Context, Objective, Style, Tone, Audience, Response

    Quando usarlo: quando, oltre al contenuto, vuoi anche che il testo abbia dei precisi stili e toni.

    Context > Objective > Style > Tone > Audience > Response (formato)

    Esempio 5

    Context: Scheda prodotto per e-commerce ricambi.
    Objective: Massimizzare chiarezza e conversione.
    Style: Frasi brevi, scannable, lessico semplice.
    Tone: Affidabile, pratico, zero iperboli.
    Audience: Proprietari Vespa senza esperienza tecnica.
    Response: 1 paragrafo 120–150 parole + 3 bullet + CTA finale.
    

    SiCQuA — Situation, Complication, Question, Answer

    Quando usarlo: per strutturare una micro-narrazione che sciolga i dubbi del cliente.

    Situazione
    Complicazione
    Q-domanda
    Azione (risposta)

    Esempio 6

    Situation: Chi cerca ricambi Vespa vuole compatibilità certa.
    Complication: Modelli/anni generano confusione.
    Question: Questo kit serratura 299676 è giusto per me?
    Answer: Elenca modelli compatibili (ET2, ET4, Liberty…), spiega installazione base,
    ricorda garanzia/resi, chiudi con CTA.
    

    PEAS — Performance, Environment, Actuators, Sensors

    E’ il più tecnico dei framework, usalo quando devi progettare un agente/pipeline che generi e validi la scheda.

    Performance: [metriche/SLAs]
    Environment: [dove opera, vincoli]
    Actuators (Output): [cosa produce]
    Sensors (Input): [quali dati/fonti usa]
    + Failure modes & Fallback

    Esempio 7

    Performance: 100% nomi modello validi; ≤2 errori ortografici; leggibilità ≥60.
    Environment: Catalogo interno + DB compatibilità; privacy GDPR.
    Actuators: Blocco HTML scheda prodotto + JSON compatibilità.
    Sensors: SKU 299676, lista modelli, manuale tecnico.
    Failure & Fallback: se compatibilità mancante → chiedi conferma; se conflitti → mostra alert.

    Da grezzo a pro: lo stesso prompt che “cresce”

    Ok, se prima di questo articolo non eri un prompter professionista 😉 adesso sai che un prompt non è una frase “magica”: è progettazione.

    Parti da PAM, aggiungi SMART per definire cosa significa “buono”, struttura con RACE.

    Quando serve coerenza di brand e audience, passa a TRACE/CO-STAR. Se devi educare e convincere, usa SiCQuA. E quando vuoi scalare con affidabilità, modella il sistema con PEAS.

    Ecco gli esempi pratici:

    PAM → SMART

    PAM v1: Scrivi una scheda prodotto per kit serratura baule Vespa 299676.
    Modify: 120–150 parole, 3 bullet (compatibilità, installazione, garanzia), CTA finale.
    SMART: Leggibilità ≥60; evita superlativi generici; niente termini tecnici non spiegati.

    RACE → TRACE → CO-STAR

    RACE: Role (copy e-commerce) + Action (scheda) + Context (target fai-da-te) + Execute (formato).
    TRACE: aggiungi Audience (ET2/ET4/Liberty) + Example (tono pratico).
    CO-STAR: separa Objective (conversione) da Style/Tone (chiaro, affidabile) e Response (formato).
    

    SCQA → PEAS

    SCQA: incornicia i dubbi (“è compatibile con il mio modello?”) e rispondi in ordine logico.
    PEAS: progetti l’agente che pesca i dati, valida la compatibilità e genera l’HTML finale.
    

    Checklist (copia e incolla)


    • PAM: prova → leggi → modifica una cosa alla volta.
    • SMART: aggiungi 2–3 metriche verificabili.
    • RACE: ruolo chiaro + compito + contesto + formato.
    • TRACE: dichiara il pubblico e metti un mini-esempio.
    • CO-STAR: separa obiettivo da stile/tono; definisci il formato di risposta.
    • SiCQuA: situazione → problema → domanda → risposta/azioni.
    • PEAS: metriche, input/output, errori previsti, fallback.
  • I Browser “Agenti” con AI sono INSICURI

    I Browser “Agenti” con AI sono INSICURI

    I Browser alimentati dagli “Agenti AI” sono una minaccia per la sicurezza e dovremmo evitarli

    Ammettilo, stai pensando di provare uno dei nuovi browser alimentati da Intelligenza Artificiale come OpenAI Atlas, Comet di Perplexity o simili.
    Fermati immediatamente.
    La comodità di un assistente che naviga il web al posto tuo non vale il rischio estremo a cui stai esponendo i tuoi dati, i tuoi file e persino i tuoi conti correnti.

    Non osono congetture o previsioni malsane, un rapporto di sicurezza di Brave, noto per il suo browser focalizzato sulla privacy, ha lanciato un allarme chiaro: questi “browser agenti” presentano vulnerabilità strutturali che li rendono estremamente suscettibili a una nuova e subdola forma di attacco informatico: l’iniezione di prompt tramite siti web (prompt injection).

    Il Cavallo di Troia Digitale: Come Funziona l’Attacco

    Il pericolo non viene da un virus tradizionale, ma da istruzioni nascoste in bella vista. Ecco il meccanismo, passo dopo passo:

    1. L’Esca dell’Aggressore: Un malintenzionato inserisce comandi nascosti in una pagina web. Spesso si tratta di testo camuffato (ad esempio, bianco su sfondo bianco) o di metadati invisibili all’occhio umano. Tu non lo vedi, ma l’agente AI sì.
    2. L’AI Legge l’Inganno: Il tuo agente AI/Copilot, incaricato di navigare o elaborare quella pagina, carica e legge tutto il testo presente, compreso il prompt nascosto.
    3. L’Obbedienza Pericolosa: Il modello LLM è progettato per seguire le istruzioni, sicché tratta quel testo nascosto come un comando legittimo da eseguire.
    4. La Porta Aperta: Le Tue Autorizzazioni: Il danno che ne segue dipende interamente da quanta libertà hai concesso al browser. Questi agenti, come riportato da ricercatori, operano spesso con alti livelli di privilegio.

    Le Conseguenze:

    Quello che viene definito “jailbreaking del browser” può portare a scenari da incubo:

    Furto di Dati Sensibili: l’agente ha accesso alle tue conversazioni e può trasmettere l’intera cronologia chat, compresi i dati personali e finanziari che hai condiviso.

    Azioni Non Autorizzate: Se ha accesso a strumenti di sistema o API (come detto su BankInfoSecurity.asia), l’AI dirottata può utilizzare quelle funzionalità per:

    • Aprire applicazioni dannose.
    • Leggere, modificare o eliminare file personali dal tuo computer.
    • Utilizzare le tue credenziali per accedere a servizi bancari o di investimento e prosciugare i conti.
    • Rubare cookie di sessione, prendendo il controllo dei tuoi account online.

    Il risultato finale? Un’attacco che può variare dall’esposizione di dati privati all’agente che agisce autonomamente per tuo conto, con tutte le autorizzazioni che gli hai concesso.

    Cosa serve che facciano prima

    Per rendere questa tecnologia meno rischiosa, così come hanno fatto per ani gli sviluppatori degli attuali browser, dovrebbero implementare misure drastiche come isolare la navigazione agentica da quella umana in sandbox sicure e richiedere il consenso esplicito dell’utente per ogni azione critica, come l’apertura di un sito o l’invio di un’email.

    Tuttavia, questi sono cambiamenti di lungo periodo. Nel frattempo, la tua sicurezza è nelle tue mani.

    Raccomandazione pratica:

    Se hai già installato uno di questi browser e gli hai concesso l’accesso a credenziali, documenti o cartelle di sistema, agisci immediatamente:

    1. Disinstalla il browser agente.
    2. Modifica al più presto tutte le password e le credenziali a cui potrebbe aver avuto accesso.
    3. Torna all’uso sicuro: utilizza servizi come ChatGPT all’interno di una normale finestra del browser standard (Chrome, Firefox, Safari, Edge, ecc.), senza concedergli alcun accesso speciale a dati, file o strumenti di sistema.

    Non fare la cavia in un esperimento pericoloso. La promessa di un navigatore AI personale è allettante, ma i rischi attuali sono reali e concreti. Per ora, il modo più sicuro di interagire con l’AI è farlo in un ambiente controllato e limitato, non dandogli le chiavi di casa tua.

  • Perché con l’IA in Medicina stiamo sbagliando bersaglio

    Perché con l’IA in Medicina stiamo sbagliando bersaglio

    Una recente ricerca di Anthropic ha rivelato un fatto che dovrebbe far riflettere chiunque si occupi di intelligenza artificiale: bastano 250 documenti “avvelenati” – una frazione infinitesimale, lo 0,00016% di un dataset – per sabotare il comportamento di un grande modello linguistico.

    Questo fenomeno, il cui nome è data poisoning, dimostra una verità matematica spietata: la qualità di un’IA è intrinsecamente legata all’integrità dei dati su cui si allena. Basta una quantità minuscola di dati sbagliati per corrompere il tutto.

    Ora, facciamo un salto dalla sicurezza informatica alla salute pubblica.

    Se l’introduzione di una manciata di dati tossici può essere così devastante, immaginate l’effetto catastrofico dell’assenza totale di una massa enorme di dati veri e puliti.

    È esattamente quello che sta succedendo oggi all’IA in medicina.

    Il “Data Poisoning” Invisibile della Sanità

    Mentre Anthropic testava quanto sia facile avvelenare un dataset, il nostro sistema sanitario sta inconsapevolmente commettendo un errore opposto ma altrettanto pericoloso: sta morendo di fame.

    Gli algoritmi che promettono di rivoluzionare la diagnostica sono addestrati quasi esclusivamente sui dati digitali dei grandi ospedali. Ma questo rappresenta solo una parte della storia clinica.

    Dov’è il restante 20-30%?
    È quel paziente dimesso dall’ospedale con una diagnosi incompleta che trova la soluzione in un ambulatorio territoriale. È quella diagnosi corretta, arrivata dopo settimane di esami mirati, che svanisce nel mare della carta di uno studio non digitalizzato.

    Questo non è un semplice buco, è un’avvelenamento per assenza.
    Stiamo costruendo un’IA “zoppa”, addestrata su una realtà clinica mutilata. Se bastano 250 documenti corrotti per deviare un modello, l’assenza di milioni di diagnosi corrette dal territorio rende l’IA medica intrinsecamente inaffidabile e pericolosamente parziale.

    La soluzione è curare la fonte o il sintomo?

    Il problema non è la tecnologia IA ma la catena di approvvigionamento dei dati.

    Le piccole strutture sanitarie – il cuore pulsante della cura sul territorio – non sono digitalizzate a causa di costi proibitivi, complessità normative e mancanza di tempo.

    La startup Medigenium ha creato MeRis per risolvere questo problema alla radice.

    Quanto costa l’antidoto al “data poisoning” strutturale dell’IA medica? ZERO.
    Anzi regala tra 10 e 20 mila auro agli ambulatori che la scelgono.

    MeRis è un dispositivo che, fornito in comodato d’uso gratuito, si collega agli strumenti medici esistenti e genera dataset completi e puliti, l’antidoto al “data poisoning” strutturale dell’IA medica.

    Non stiamo lottando contro un’IA che sbaglia. Stiamo lottando per dare all’IA tutti i dati di cui ha bisogno per non sbagliare.

    La lezione di Anthropic è chiara: l’integrità del dato è tutto. La nostra missione è garantire che l’IA in medicina sia nutrita con il 100% della verità clinica, non solo con la parte comodamente digitale.

    Perché ogni paziente curato in un ambulatorio periferico ha il diritto di contribuire al progresso della medicina, e di beneficiarne.

  • Verso l’approccio AGNOSTICO

    Verso l’approccio AGNOSTICO

    Negli ultimi giorni Microsoft ha annunciato che non si affiderà più a un unico modello di intelligenza artificiale (OpenAI), ma integrerà anche Anthropic, aprendo la strada a un futuro multi-modello.
    Nell’articolo, questa scelta viene descritta esplicitamente come un approccio “agnostico”: non vincolarsi a un solo modello, ma sfruttare di volta in volta quello più adatto.

    https://thereview.strangevc.com/p/microsofts-model-switch-why-ai-middleware

    Tra le motivazioni principali spiccano due aspetti:

    • Flessibilità: la possibilità di usare il modello giusto per il compito giusto.
    • Evoluzione naturale: entro 12 mesi ogni prodotto enterprise AI supporterà almeno due modelli.

    Quando ho letto queste parole, ho sorriso.

    Perché questa stessa intuizione io l’avevo già colta alla fine del 2024. Dopo tanti rimandi, a marzo, sfruttando l’occasione di una demo, ho deciso di mettere mano a una prima bozza del progetto.

    Il 26 giugno ho completato l’MVP, che ancora oggi recita:

    “u-prompt: Ciao. Questo MVP serve a dimostrare che u-prompt è un sistema chatbot-agentico alimentato dall’intelligenza artificiale –>e agnostico<–, nel senso che durante la tua chiacchierata puoi decidere di –>utilizzare agenti differenti<– per rispondere a singole domande ad esempio per sfruttarne –>le caratteristiche speciali<–.”

    Nei giorni successivi, confrontandomi con alcuni amici, abbiamo deciso di portare avanti il progetto e fissato la data del go-live: 15 settembre. Una scelta fatta mesi prima che Microsoft rendesse pubblica la sua svolta.

    Domani, 18 settembre, la startup viene presentata a Palermo ai cantieri culturali alla Zisa nell’ambito di un evento sull’AI.

    La differenza?

    Mentre Microsoft annuncia oggi di voler lavorare con due modelli, in u-prompt abbiamo già messo insieme, per la prima volta, cinque modelli diversi in un unico prompt.

    Questo percorso – dall’MVP al progetto online – dimostra che non viviamo di parole, ma di fatti. E soprattutto dimostra, prepotentemente, una capacità di anticipare il futuro e affrontare le sfide senza paura.

    Interessati? -> hey[at]u-prompt.com

    Early adopters? -> u-prompt.com

  • Le Innovazioni dell’AI: GPT-5, Grok4 e il salto quantico di Claude

    Le Innovazioni dell’AI: GPT-5, Grok4 e il salto quantico di Claude

    E’ agosto e mentre noi ci prendiamo le ferie il mondo dell’intelligenza artificiale sta vivendo un momento di accelerazione straordinaria.

    Qui vi parlo del lancio delle innovazioni da parte dei principali attori del settore: OpenAI, xAI e Anthropic, l’ultimo dei quali fa il vero salto quantico. Vedremo anche le risposte di Google e DeepSeek. Ogni azienda ha scelto una strategia diversa, ma tutte spinte dalla concorrenza a dare di più.

    OpenAI e GPT-5: Quando la Trasparenza Diventa Spettacolo

    OpenAI ha rilasciato GPT-5 il 7 agosto 2025, rendendolo accessibile fin da subito come opzione predefinita per tutti gli utenti, anche quelli che usufruiscono del servizio gratuitamente.

    GPT-5 integra un sistema che decide in autonomia se fornire una risposta rapida o se “prendersi del tempo per pensare”, scegliendo l’approccio migliore per ogni richiesta senza che l’utente debba modificare alcuna impostazione.

    Questa funzionalità trasforma quello che era un processo noioso in una vera e propria esperienza visiva.

    Il ‘giochino di animazione’ di GPT-5 mostra all’utente esattamente come arriva alle sue conclusioni, rappresentando un perfetto esempio di gamification applicata all’AI: l’intrattenimento visivo compensa i tempi più lunghi necessari per il ragionamento.

    Caratteristiche chiave di GPT-5:

    • Ragionamento trasparente: mostra il processo di pensiero in tempo reale;
    • Riduzione delle allucinazioni: circa dell’80% inferiore di errori fattuali rispetto a o3;
    • Accessibilità totale: disponibile gratuitamente per tutti gli utenti.

    Grok4: La Sfida di Elon Musk

    xAI ha lanciato Grok 4 il 10 luglio 2025, e Musk lo ha presentato nel suo inconfondibile stile di affermazioni audaci: “l’intelligenza artificiale più intelligente al mondo”.

    Le principali innovazioni di Grok4:

    Sistema Multi-Agente con Grok 4 Heavy

    E’ un approccio collaborativo e rappresenta una novità assoluta nel settore, perché permette a diversi “cervelli artificiali” di lavorare insieme su problemi complessi. In Italia, SuperGrok Heavy costa 349€ al mese, il prezzo più elevato tra le soluzioni IA consumer ad oggi.

    Prestazioni da Record

    Ovviamente i risultati sui benchmark sono impressionanti:

    • Humanity’s Last Exam: outperforming Google’s Gemini 2.5 Pro and OpenAI’s o3 (high)
    • ARC-AGI-2: il risultato di 16.2% è quasi il doppio del migliore modello commerciale di AI

    Produzione di Immagini

    Anche Grok 4, come SORA o VEO è in grado di produrre immagini e video, questi ultimi però solo attraverso abbonamenti premium.

    Anthropic e Claude: Il Vero Salto Quantico

    Ma il vero “salto quantico” lo fa Anthropic. Claude che ora ha la capacità di ritrovare e referenziare le chat precedenti risolve quello che era il limite più frustrante di tutti i chatbot AI: la perdita di memoria conversazionale.

    Fine del Limite Fisico!

    Tradizionalmente, ogni conversazione con un AI ha un limite massimo di token (parole) che può processare e che, una volta raggiunto, richiede di ricominciare da capo perché il modello “dimentica” l’inizio della conversazione.

    Beh, adesso Claude non ha più questo problema perché può accedere a tutta la storia delle conversazioni passate:

    • Ricordare progetti sviluppati in conversazioni precedenti
    • Mantenere il contesto di discussioni complesse sviluppate in sessioni multiple
    • Continuare analisi iniziate settimane o mesi prima
    • Costruire una vera “memoria di lavoro” a lungo termine

    Questa funzionalità trasforma Claude in un vero assistente personale, in grado di mantenere il filo del discorso e l’evoluzione del pensiero dell’utente nel tempo.

    A) Quando aprite Claude vi viene chiesto se lo volete autorizzare a leggere le vecchie/altre conversazioni.

    B) Questo è il mio segreto per evitare le “allucinazioni” del modello (come per GPT-5 rispetto GPT-o3 😎).

    Google/Gemini

    Google è rimasta a guardare? Le risposte significative presentate al Google I/O 2025 e implementate durante l’estate si concentrano su tre pilastri: sistemi multi-agente, capacità agentiche e integrazione profonda nell’ecosistema Google.

    Gemini 2.5 Deep Think: Il Sistema Multi-Agente

    Il 1° agosto 2025, Google ha rilasciato Gemini 2.5 Deep Think, il suo primo sistema multi-agente che, come xAi-Grok4-Heavy genera multipli agenti AI per affrontare una domanda in parallelo, un processo che utilizza significativamente più risorse computazionali di un singolo agente, ma tende a produrre risposte migliori.

    La caratteristica più interessante di Deep Think è che è capace di produrre “risposte molto più lunghe” rispetto agli altri prodotti di AI in commercio.

    Infine una nota importante per chi fa commercio elettronico, viene introdotto lo Shopping agentico: funzionalità di checkout automatico che effettua acquisti quando il prezzo è giusto

    E DeepSeek?

    Nel 2025 è emerso un protagonista inaspettato che ha scosso le fondamenta dell’industria AI: DeepSeek, un laboratorio di ricerca cinese che ha dimostrato come l’innovazione possa nascere da limitazioni apparenti.

    Il modello è 100% gratuito in chat e poco costoso via API, si distingue per diverse caratteristiche innovative. Al momento in cui scrivo questo articolo non ci sono speciali annunci o rilasci in risposta alle mosse dei “concorrenti”.

  • Silver Startupper: Quando l’esperienza fa davvero la differenza (anche nell’AI)

    Silver Startupper: Quando l’esperienza fa davvero la differenza (anche nell’AI)

    Siamo abituati a immaginare gli startupper come giovani ventenni, entusiasti e privi di timori, ma oggi dati e realtà ci dicono qualcosa di diverso: l’età media dei fondatori di startup di successo si aggira sui 45 anni.

    Per anni, il messaggio diffuso è stato chiaro: “l’innovazione appartiene ai giovani”. Ma basta guardarsi intorno per capire che la narrativa sta cambiando. Herbert Boyer fondò Genentech, poi valutata 47 miliardi di dollari, quando aveva 40 anni; David Duffield avviò Workday a 64 anni, creando un colosso oggi valutato oltre 43 miliardi. Persino nel settore dell’intelligenza artificiale si inizia a comprendere che l’esperienza non è un ostacolo, bensì un vantaggio competitivo.

    I fondatori senior portano al tavolo qualcosa di unico: l’esperienza accumulata negli anni, una profonda conoscenza del mercato e, soprattutto, una gestione matura del fallimento. Dopo aver già sperimentato le insidie del mercato e vissuto sulla propria pelle almeno un insuccesso, chi supera una certa età affronta le nuove sfide con una consapevolezza diversa. Sa cosa evitare, quali rischi correre e soprattutto come affrontare i momenti difficili.

    Questa maturità si riflette direttamente anche nella gestione finanziaria: gli imprenditori senior hanno esperienza, sono più cauti con i capitali e dispongono di reti di contatti consolidate, aspetti cruciali per una startup che vuole crescere rapidamente.

    Eppure, nonostante questi vantaggi evidenti, in Italia persiste una sorta di discriminazione anagrafica. Le istituzioni puntano quasi esclusivamente sui giovani under 40 e sulle donne, ignorando completamente l’enorme potenziale dell’esperienza che possono apportare gli imprenditori maturi. Oggi, infatti, non esiste praticamente nessun incentivo pubblico italiano specificamente rivolto agli imprenditori che superano i 55 anni, mentre per donne e giovani sotto i 35 anni sono stati stanziati centinaia di milioni di euro tramite il PNRR.

    Personalmente, ho sperimentato quanto possa essere frustrante cercare risorse per avviare progetti innovativi nel nostro paese in generale e specialmente superati certi limiti di età, tuttavia, questa esperienza mi ha spinto ancora di più verso l’innovazione, portandomi a creare u-prompt, una piattaforma destinata a democratizzare l’accesso corretto e professionale all’intelligenza artificiale, la prima del suo genere in Italia e probabilmente in Europa.

    u-prompt ha già un chatbot multicanale che fa risparmiare almeno 40€ al mese ai professionisti, ma presenterà un agente-chatbot innovativo capace di replicare tutte le funzionalità avanzate dei principali strumenti AI presenti oggi sul mercato, ad una frazione del costo attuale. Questo consentirà ai professionisti del settore di risparmiare da un minimo di 100€ fino a 800€ al mese, mentre gli appassionati e gli hobbisti potranno finalmente accedere a tecnologie AI finora economicamente fuori dalla loro portata.

    L’MVP di questo agente-chatbot è già disponibile per chi vorrebbe investire nella start-up.

    Un tasso di successo del 70%
    Tra gli oltre 1,5 milioni di imprenditori nel mondo, quelli sopra i 50 anni hanno maggiori probabilità di avere successo rispetto alle controparti più giovani. Oggi negli Stati Uniti un’impresa su tre è avviata da qualcuno di 50 o più anni. Ma c’è di più. Se solo il 28% delle start up create dai giovani durano più di tre anni, per quelle accese da over 60 il tasso di successo è del 70 per cento. È quanto mette nero su bianco il rapporto “The Longevity Economy” realizzato dall’Aarp and Oxford Economics. «Poter fisicamente e psicologicamente lavorare significa anzitutto riconoscere il proprio contributo alla società di cui si è parte, poter produrre reddito, non gravare sulle pensioni e quindi sui giovani per dover finanziare i più vecchi. Significa anche avere capacità di spesa, permettere all’economia di rimanere in un ciclo attivo», precisa Palmarini, che prospetta un futuro ancora più determinato dalla generazione silver.

    Come correttamente riportato nell’articolo su Sole24Ore e non mi sento affatto escluso dalla corsa all’innovazione per via della mia età, al contrario, sono convinto che proprio l’esperienza maturata negli anni possa fare la differenza nella capacità di leggere il mercato, anticipare i bisogni degli utenti e costruire soluzioni realmente efficaci.

    u-prompt è il risultato di questa convinzione, un progetto che mostra chiaramente come il valore dell’esperienza, del fallimento e della resilienza possa tradursi in innovazioni concrete e di successo, sfidando ogni pregiudizio anagrafico.

  • l’AI ucciderà Google?

    l’AI ucciderà Google?

    L’algoritmo con cui funziona il motore di ricerca di Google può tranquillamente sopravvivere all’AI, pertanto sono sempre stato scettico sulla longevità dell’algoritmo del motore di ricerca… ma:

    pare che il modo in cui cerchiamo informazioni online sta cambiando.

    Una recente analisi ha mostrato che oltre il 50% delle ricerche su Google si conclude senza clic (che è la base di funzionamento di quell’algoritmo). Tra i motivi c’è il fatto che spesso gli utenti trovano risposte direttamente nella pagina dei risultati.

    Infine è significativo il rapido aumento degli utenti che si affidano direttamente all’intelligenza artificiale senza passare dal motore di ricerca.

    Mentre per gli utenti finali è tutto grasso che cola, per chi vive esclusivamente di traffico organico basato su Google è un problema. Se oltre il 40% del traffico del sito arriva ancora da Google, potrebbe succedere che venga eliminato direttamente dalle risposte sintetizzate delle AI.

    Scrivere per i modelli, non per i motori

    La soluzione potrebbe non essere più “ottimizzare per l’algoritmo di Google”, ma creare contenuti pensati per essere letti, compresi e utilizzati dalle intelligenze artificiali, ovvero diventare una fonte autorevole citata direttamente nelle risposte generate dagli LLM (Large Language Models).

    Google continuerà a servire per ricerche specifiche, come trovare siti ufficiali, documenti o pagine precise. Ma per sintesi, ragionamenti e analisi, l’intelligenza artificiale è già un passo avanti.

    Dunque quale sarà il futuro del controllo dei contenuti?

    Il classico file robots.txt, usato dai siti web per indicare ai motori di ricerca quali contenuti possono essere indicizzati, potrebbe presto evolversi in llms.txt. Questo nuovo file, proposto recentemente, è concepito per regolare l’accesso ai contenuti web da parte dei modelli linguistici come ChatGPT e Bard.

    llms.txt nasce proprio per rispondere a una domanda cruciale:

    come impedire (o favorire) l’utilizzo dei propri contenuti da parte delle intelligenze artificiali?

    Tuttavia, allo stato attuale è soltanto una proposta senza valore pratico immediato, poiché nessun grande player dell’AI ha ancora ufficialmente adottato questo standard.

    Cosa possono fare le aziende oggi?

    In attesa di sviluppi le aziende dovrebbero:

    • Continuare a usare robots.txt per gestire l’accesso dei bot AI noti, come GPTBot.
    • Valutare attentamente quali contenuti consentire o bloccare.
    • Monitorare regolarmente i log del server per tracciare l’attività dei bot delle AI.
    • Mantenere un’alta qualità e autorevolezza dei contenuti, perché le AI riescono a identificare le fonti più affidabili (e se i tuoi contenuti sono generati dall’AI).

    I miei 2c sull’approccio vincente: sarà quello flessibile e proattivo. In pratica prepararsi oggi per essere pronti domani, informarsi sempre e prepararsi a strumenti come llms.txt che potrebbero diventare essenziali a breve.