AI sotto esame: quando i modelli falliscono e le regole cambiano
Riassunto
L'AI affronta una settimana di verità: Apple dimostra che i modelli di reasoning non pensano davvero, scatenando un dibattito feroce. Gli USA propongono nuove regole che richiedono trasparenza totale in cambio di protezione legale. Nvidia taglia la Cina dalle previsioni, rinunciando a 8 miliardi di ricavi. Google sfida l'architettura dominante con Gemini Diffusion, 4 volte più veloce dei modelli tradizionali. Nel frattempo, le startup AI raccolgono centinaia di milioni, ma molte sono solo "Cursor for X" - variazioni dello stesso tema.
Apple smonta l'hype: i modelli AI non ragionano davvero
Ecco la verità che nessuno vuole sentire: i modelli di reasoning AI tanto celebrati non pensano affatto. Apple ha pubblicato uno studio devastante che dimostra come GPT-4o, Gemini e gli altri "geni" dell'AI crollano miseramente quando i compiti diventano complessi.
Lo studio ha testato i modelli su puzzle classici come Torre di Hanoi e problemi di logica. Risultato? Performance zero sui compiti difficili. Ma il vero colpo di grazia arriva dalla scoperta che questi modelli non stanno ragionando - stanno solo facendo pattern matching sofisticato.
La community AI è esplosa. Alcuni ricercatori accusano Apple di aver progettato test truccati, altri gridano al complotto perché Apple è indietro nella corsa AI. Ma c'è un problema più profondo: stiamo vendendo come "reasoning" quello che è solo autocomplete avanzato.
Un nuovo studio di risposta, scritto ironicamente anche da Claude Opus, cerca di smontare le conclusioni di Apple. Il dibattito è feroce, ma solleva la domanda scomoda: se i nostri migliori modelli AI falliscono test che un bambino risolverebbe, cosa stiamo davvero costruendo?
USA: nuove regole AI tra trasparenza e safe harbor
Il Congresso americano si muove mentre il mondo brucia. Due proposte di legge stanno ridisegnando il panorama AI: il RISE Act federale e il RAISE Act di New York, entrambi con un messaggio chiaro alle Big Tech.
Il RISE Act del Senatore Lummis offre un patto faustiano: immunità legale in cambio di trasparenza totale. Le aziende AI dovranno pubblicare dati di training, metodi di valutazione e specifiche complete dei modelli. Miss the deadline? Addio protezione legale.
New York ha fatto il primo passo approvando il RAISE Act, che richiede report di sicurezza dettagliati per i modelli frontier. Penali fino a 30 milioni di dollari per chi non rispetta le regole. Silicon Valley sta già gridando al sabotaggio della competitività americana.
Ma dietro le quinte si nasconde la vera partita: chi controllerà l'AI del futuro? Mentre l'Europa stringe con l'AI Act e gli USA tentano un approccio più morbido, le aziende stanno già minacciando di ritirarsi dai mercati "ostili". La frammentazione globale dell'AI è iniziata.
Nvidia taglia la Cina: addio a 8 miliardi di ricavi
Jensen Huang ha fatto i conti e la matematica è brutale: la Cina non esiste più nelle previsioni di Nvidia. Il CEO ha annunciato che l'azienda escluderà completamente il mercato cinese dai forecast di ricavi e profitti.
La mossa arriva dopo che l'amministrazione Trump ha introdotto licenze obbligatorie anche per i chip H20, gli unici che Nvidia poteva ancora vendere in Cina. Risultato: 8 miliardi di dollari di ricavi evaporati nel secondo trimestre.
Huang è stato chiaro: non conta sul fatto che Washington faccia marcia indietro sulle restrizioni. Se dovesse succedere, sarebbe un "bonus", ma Nvidia ha già voltato pagina. La guerra tecnologica USA-Cina ha il suo primo grande scalpo.
Questa non è solo una perdita per Nvidia - è il segnale che la biforcazione tecnologica globale è irreversibile. Mentre la Cina accelera sullo sviluppo di chip domestici, l'Occidente si prepara a un mondo dove le supply chain tech sono completamente separate.
Google sfida l'architettura GPT con la diffusion
Dimentichiamo l'autoregression: Google DeepMind ha svelato Gemini Diffusion, un approccio rivoluzionario che potrebbe mandare in pensione l'architettura GPT. Invece di generare testo parola per parola, il modello parte dal rumore e lo raffina gradualmente in output coerente.
I numeri parlano chiaro: 1.000-2.000 token al secondo contro i 272 di Gemini Flash. La velocità è solo l'inizio - i modelli diffusion possono correggere errori durante la generazione e processare blocchi di testo in parallelo.
Brendan O'Donoghue di DeepMind spiega i vantaggi: latenze più basse, computazione adattiva e reasoning non-causale. Il modello può "guardare avanti" nel testo che sta generando, permettendo correzioni globali impossibili con l'autoregression.
Ma c'è un trade-off: costi di serving più alti e tempo maggiore per il primo token. Google sta scommettendo che la velocità complessiva compenserà questi svantaggi. Se hanno ragione, stiamo assistendo al più grande shift architetturale dall'invenzione del Transformer.
Startup AI: 215 milioni per comprimere, 3 miliardi per vendere
Il denaro scorre a fiumi nell'ecosistema AI, ma con logiche sempre più precise. Multiverse Computing ha raccolto 215 milioni per la sua tecnologia di compressione che riduce i modelli del 95% senza perdere performance. Clay ha chiuso un round da 3 miliardi di valutazione per i suoi tool di sales automation.
Y Combinator ha mostrato il futuro: ogni startup è "Cursor for X". Den vuole essere Cursor per knowledge worker, Vessence per avvocati. Il pattern è chiaro - prendere un tool AI di successo e applicarlo a un verticale specifico.
Ma dietro l'euforia si nascondono segnali preoccupanti. La maggior parte delle startup presenta variazioni dello stesso tema: agenti AI, automazione, tool per sviluppatori. L'innovazione vera scarseggia, mentre i round si gonfiano.
Multiverse rappresenta l'eccezione: tecnologia basata su tensor networks quantistici che risolve un problema reale - far girare AI su dispositivi edge. Mentre tutti inseguono l'hype degli agenti, loro costruiscono l'infrastruttura per democratizzare l'AI.
Da Leggere Più Tardi
Approfondimenti e letture consigliate per esplorare ulteriormente gli argomenti trattati
Altre storie che meritano attenzione: Google espande Gemini AI con riassunti automatici di PDF e form, mentre testa Audio Overviews stile podcast nei risultati di ricerca. Il Regno Unito accelera sull'AI con 1,4 miliardi per aumentare la potenza di calcolo di 20 volte, mentre il ministro esorta i lavoratori ad abbracciare l'AI o rimanere indietro. Sul fronte sicurezza, esperti sottolineano l'importanza del red teaming e degli audit trail nei sistemi AI. Infine, il Dipartimento dei Trasporti USA vuole semplificare le esenzioni per veicoli autonomi senza volante e pedali.
Naviga nel tema
Ricevi digest come questo direttamente su Telegram
Unisciti a migliaia di utenti che ricevono quotidianamente analisi curate su innovazione e ai. Informazione di qualità, zero spam.
Iscriviti al canale Innovazione e AI