Arriva l’intelligenza artificiale a basso costo

27/01/2025

I Future (le previsioni sull’apertura di oggi) sul Nasdaq -3%

La semisconosciuta startup cinese, DeepSeek, ha cambiato stanotte i connotati del mercato.

Innovazione underdog: Con un modello 10 volte più efficiente di Meta, la startup sfida i giganti americani nonostante le sanzioni.

High-Flyer, un fondo quantitativo cinese ha trasformato tutto il suo reparto Ricerca & Sviluppo per costruire un’intelligenza artificiale generale (argomento che approfondiremo in un post dedicato).

Si chiama DeepSeek.

In pochi conoscevano l’esistenza di questa azienda, messa in piedi da un gestore di un fondo quantitativo, Bloomberg fa notare stamattina che DeepSeek è il nome più cercato da stanotte sul terminale.
La prima reazione degli investitori è stata quella di puntare sulle società quotate a Hong Kong associabili alla startup dell’intelligenza artificiale a basso costo, la seconda è stata quella di andare short sui grandi nomi dell’high tech degli Stati Uniti: il future del Nasdaq è in calo del 3%.

“Non cerchiamo profitti immediati, ma risposte alle domande più difficili del mondo”,

ha dichiarato Liang.

Il risultato di questa filosofia è DeepSeek-R1, modello open source che supera OpenAI o1 in matematica e logica, usando un decimo delle risorse di Llama 3.1. Il segreto? “Fare di necessità virtù”, spiega Marina Zhang dell’Università di Sydney. Senza accesso ai chip Nvidia più avanzati, DeepSeek ha rivoluzionato l’architettura dei modelli, creando algoritmi che comunicano come un’orchestra jazz: pochi strumenti, massima sintonia.

E ora fanno tremare il ricco (e costoso, anche in termini di risorse energetiche) mondo dell’AI Occidentale.

Liang Wenfeng:
Giovani geni e patriottismo: la ricetta segreta (e un po’ anarchica).
Mentre Google e Meta assumono veterani (e talenti dall’estero), DeepSeek punta su neolaureati di Pechino e Tsinghua: cervelli affamati di gloria accademica, non di stipendi d’oro.

“Assumiamo chi ha vinto premi internazionali, anche con zero esperienza industriale”, ammette Liang.

Un approccio che paga: il team ha sviluppato la Multi-head Latent Attention, una tecnica che riduce del 40% il consumo di memoria.

“Sono come startup degli anni ’70: pochi soldi, tanta creatività”

dice Wendy Chang, analista del Mercator Institute.

“Hanno combinato trucchi d’ingegneria: schemi di comunicazione custom, compressione dati…
Roba nota, ma mai usata così”.

Ne parleremo ancora, sicuramente.

Grazie delle informazioni a:
– Gianluca Riccio
– Investing

Arriva l’intelligenza artificiale a basso costo

I Future (le previsioni sull’apertura di oggi) sul Nasdaq -3%

Si chiama DeepSeek.

Menu

Corsi