Scommesse da trilioni di dollari e il reality check che l'AI ha bisogno
Riassunto
Apple trasforma finalmente l'iPad in un computer vero con iPadOS 26, ma rimanda la Siri AI avanzata. Meta scommette 15 miliardi su Scale AI nella corsa all'AGI, mentre OpenAI scatena una guerra dei prezzi tagliando i costi dell'80%. Un paper di Apple demolisce le capacità di reasoning dei modelli miliardari che falliscono su puzzle per bambini. Mistral entra nella battaglia con i suoi primi modelli reasoning europei.
Meta scommette 15 miliardi su Scale AI: la corsa all'AGI si fa seria
Mark Zuckerberg sta giocando la partita più importante della sua carriera. Meta è vicina a finalizzare un investimento di quasi 15 miliardi di dollari in Scale AI, acquisendo il 49% della società che fornisce dati di training ai giganti dell'AI. È il più grande investimento esterno nella storia di Meta.
Zuckerberg sta personalmente assemblando un team di 50 persone per accelerare gli obiettivi AI di Meta, con l'obiettivo dichiarato di raggiungere l'intelligenza artificiale generale (AGI). Alexandr Wang, CEO di Scale AI, si unirà al gruppo una volta completato l'accordo.
Dietro questa mossa c'è una verità scomoda: Meta è preoccupata di rimanere indietro nella corsa all'AI. A maggio, l'azienda ha ritardato il lancio del suo nuovo modello flagship "Behemoth" per preoccupazioni sulle sue capacità rispetto ai modelli concorrenti.
Mentre Amazon ha investito 8 miliardi in Anthropic e Microsoft oltre 13 miliardi in OpenAI, Meta ha capito che non può vincere questa battaglia da sola. Scale AI, che dovrebbe raddoppiare i ricavi a 2 miliardi nel 2025, rappresenta l'infrastruttura critica per addestrare i modelli del futuro.
OpenAI taglia i prezzi dell'80% e lancia o3-pro: la guerra dei costi è iniziata
Sam Altman ha appena sparato il primo colpo in quella che potrebbe essere la guerra dei prezzi più brutale nella storia dell'AI. OpenAI ha tagliato i costi del modello o3 dell'80%, portando il prezzo a 2 dollari per milione di token in input e 8 dollari in output. Contemporaneamente, ha lanciato o3-pro, la versione più potente del suo modello di reasoning.
Questo non è solo un aggiustamento di prezzo - è una dichiarazione di guerra ai concorrenti. Mentre DeepSeek offre prezzi ancora più aggressivi (da 0,07 a 0,55 dollari), e Claude Opus 4 di Anthropic costa 15 dollari in input e 75 in output, OpenAI ha trovato il punto dolce per dominare il mercato.
O3-pro costa 20 dollari per milione di token in input e 80 in output, posizionandosi come l'opzione premium per le aziende che hanno bisogno di massima affidabilità. Ma c'è un trade-off significativo: il modello è notevolmente più lento, con alcuni utenti che riportano tempi di risposta di 3 minuti e costi di 80 dollari per una semplice query.
La strategia è chiara: democratizzare l'accesso ai modelli avanzati per accelerare l'adozione, mentre si monetizza la fascia enterprise con versioni premium. È il playbook classico del software, applicato all'AI.
Quando l'AI da miliardi crolla su puzzle per bambini: il reality check di Apple
Un paper di ricerca di Apple ha appena demolito una delle narrative più pericolose dell'AI moderna. I modelli di reasoning più avanzati - ChatGPT, Claude, DeepSeek - falliscono miseramente su puzzle che un bambino di sette anni risolverebbe senza problemi.
Il Tower of Hanoi, un classico gioco con tre pioli e dischi multipli, ha messo in ginocchio i modelli più costosi del pianeta. Con sette dischi, ottengono meno dell'80% di accuratezza. Con otto dischi, praticamente non riescono a risolverlo affatto. È imbarazzante che sistemi da miliardi di dollari non riescano a risolvere problemi che Herb Simon aveva risolto con l'AI classica nel 1957.
Ma il vero problema non è tecnico - è culturale. Come ha notato il venture capitalist Josh Wolfe, Apple ha "GaryMarcus'd" le capacità di reasoning dei LLM, coniando un nuovo verbo per descrivere l'atto di smascherare le capacità sopravvalutate dell'AI.
Mentre tutto questo accadeva, ChatGPT ha subito un'interruzione parziale durata ore, con utenti che ricevevano errori "Troppe richieste simultanee". Quando i tuoi "GPU si stanno sciogliendo" per tenere il passo con la domanda, forse è il momento di ripensare se stiamo davvero costruendo un'intelligenza superiore o solo pattern matching molto costoso.
Mistral lancia Magistral: l'Europa entra nella guerra dei modelli reasoning
L'Europa non vuole rimanere spettatrice nella corsa ai modelli di reasoning. Mistral ha lanciato Magistral, la sua prima famiglia di modelli reasoning, disponibile in versioni Small e Medium. È un segnale che il laboratorio francese da 2,45 miliardi di valutazione vuole competere con OpenAI, Google e Anthropic.
Magistral Small, con 24 miliardi di parametri, è disponibile sotto licenza Apache 2.0 open source - una mossa strategica per riconquistare la fiducia della community dopo le critiche per il Medium 3 proprietario. Mistral sta giocando su due tavoli: modelli aperti per sviluppatori e versioni enterprise per monetizzare.
Sui benchmark, Magistral Medium tiene il passo ma non eccelle. Su AIME-24 ottiene il 73,6% di accuratezza, competitivo ma non rivoluzionario. Il vero vantaggio è la velocità: Mistral promette un throughput 10 volte superiore ai concorrenti in modalità "Think" e "Flash Answers".
Il pricing è aggressivo: 2 dollari per milione di token in input e 5 in output, sottoquotando significativamente OpenAI (8 dollari) e Anthropic (75 dollari). Ma c'è un problema: costa 5 volte di più del precedente Medium 3, segnalando che anche Mistral sta scoprendo che i modelli reasoning sono costosi da far girare.
Da Leggere Più Tardi
Approfondimenti e letture consigliate per esplorare ulteriormente gli argomenti trattati
Quantum computing fa il salto: IBM svela i piani per Starling, il primo computer quantistico fault-tolerant su larga scala entro il 2029, mentre Nvidia alimenta JUPITER, il supercomputer più veloce d'Europa in Germania. Android 16 arriva con Live Updates simili alle Live Activities di iPhone, mentre Google lancia nove nuove funzionalità per l'app Home. L'automazione enterprise accelera: Zip debutta 50 agenti AI per eliminare le inefficienze negli acquisti aziendali, Glean raggiunge una valutazione di 7,2 miliardi con 150 milioni di finanziamenti. AR/VR si evolve: Snap pianifica occhiali AR consumer per il 2026, mentre Qualcomm dimostra AI generativa on-device sugli smart glasses. Settori verticali innovano: Starling Bank lancia strumenti AI per analizzare le abitudini di spesa, Nvidia presenta cBottle per simulare il clima terrestre. Problemi strutturali emergono: Google AI Overviews sta uccidendo il traffico verso i publisher, mentre uno studio MIT rivela come giudichiamo davvero l'AI.
Naviga nel tema
Ricevi digest come questo direttamente su Telegram
Unisciti a migliaia di utenti che ricevono quotidianamente analisi curate su innovazione e ai. Informazione di qualità, zero spam.
Iscriviti al canale Innovazione e AI