Questa super azione potrebbe dominare l’economia dell’inferenza ia: non è Nvidia, Broadcom, Intel o AMD

Negli ultimi anni la tendenza dominante nel settore tecnologico è stata la crescita dell’intelligenza artificiale, una spinta accelerata dall’arrivo di ChatGPT nel novembre 2022, che ha portato grandi investimenti in infrastrutture, dati e modelli di linguaggio avanzati.

Il panorama si sta però trasformando: dopo una fase in cui gran parte della potenza di calcolo è stata dedicata all’addestramento dei modelli, l’attenzione si sta spostando verso l’uso operativo di quei modelli, noto come inference, che promette di guidare la crescita commerciale e l’adozione su larga scala.

Questa transizione è stata evidenziata anche da figure di rilievo del settore, come Jensen Huang, amministratore delegato di Nvidia, che ha sottolineato come il mercato stia raggiungendo un punto di svolta in cui l’inferenza potrà determinare nuovi bisogni infrastrutturali e di processori.

Dimensione del mercato e previsioni

Secondo una previsione di S&S Insider, il mercato dell’AI inference potrebbe quadruplicare, passando da circa 87 miliardi di dollari nel 2024 a circa 350 miliardi nel 2032. Questo indica che la fase di messa in produzione dei modelli potrebbe diventare il principale motore di spesa nei prossimi anni.

La crescita dell’inferenza è alimentata da strumenti agentici in grado di automatizzare processi, eseguire compiti in autonomia, aumentare la produttività e ridurre costi operativi; inoltre, l’adozione di strumenti fisici intelligenti, come i robot umanoidi, si sta avvicinando a scenari di utilizzo reale.

Processori specializzati e TPUs

Per molte applicazioni di inferenza non è necessaria la stessa enorme potenza richiesta dall’addestramento: per questo sono emersi processori specializzati come gli ASIC e soluzioni basate su CPU che offrono un bilancio migliore tra prestazioni e costi per specifici carichi di lavoro.

Un esempio sono le unità di elaborazione tensoriale, note come TPU, sviluppate da Google insieme a partner come Broadcom. Aziende che offrono servizi di intelligenza artificiale, come Anthropic, hanno scelto di ampliare l’uso di queste infrastrutture per le proprie applicazioni di inferenza.

Google ha inoltre annunciato la settima generazione delle sue TPU, denominate Ironwood, insieme a una nuova famiglia di CPU server generali, chiamata Axion, basata sull’architettura di Arm, segnalando come i fornitori stiano diversificando le piattaforme per rispondere ai diversi requisiti di inferenza.

CPU server basate su Arm e nuovi progetti

Anche altre aziende stanno puntando su CPU server basate su Arm. Nvidia, ad esempio, ha introdotto la Vera, una CPU server progettata per supportare carichi agentici e offerta anche come prodotto stand-alone, mentre in passato aveva integrato le sue Grace con GPU in sistemi rack-scale.

Questi sviluppi sottolineano la crescente competizione tra architetture: il mercato dei server è storicamente dominato da Intel e AMD con architetture x86, ma la diffusione di Arm nelle soluzioni custom per l’AI potrebbe modificare questo equilibrio.

Ruolo di Arm e modello di business basato su licenze

Arm genera ricavi concedendo in licenza i propri design e percependo royalties sui chip prodotti dai suoi clienti. Se la maggior parte delle soluzioni di inference si orienterà verso progetti custom basati su Arm, ne beneficeranno sia le entrate da licenze sia quelle da royalties.

Peraltro, l’architettura Armv9, ottimizzata per carichi AI, ha tariffe di royalty superiori rispetto alla precedente Armv8, il che suggerisce che una transizione diffusa verso Armv9 potrebbe tradursi in una crescita significativa dei ricavi nel medio-lungo termine.

Secondo stime di Counterpoint Research, la quota di server personalizzati basati su CPU Arm potrebbe salire drasticamente nei prossimi anni, passando da una quota relativamente contenuta a valori molto più elevati entro il 2029, a testimonianza della rapida adozione in corso.

Impatto economico e previsioni finanziarie

Il crescente ricorso a design custom e al licensing può aprire nuove linee di ricavo per chi detiene proprietà intellettuale, con effetti sul conto economico legati a maggiori royalties e commissioni di licenza. Alcuni analisti prevedono incrementi rilevanti degli utili per aziende di riferimento nell’arco dei prossimi anni, in relazione all’espansione dell’ecosistema dell’inferenza.

È però importante sottolineare che queste previsioni dipendono da molte variabili: velocità di adozione delle nuove architetture, scelte dei grandi hyperscaler, evoluzione dei costi produttivi e dinamiche competitive tra fornitori di chip e servizi cloud.

Considerazioni per investitori e rischi

Per chi valuta opportunità di investimento nel settore dei semiconduttori e dell’AI inference, è essenziale considerare aspetti come la sostenibilità del vantaggio tecnologico, la dipendenza da contratti con grandi clienti, la concentrazione del mercato e il ciclo di aggiornamento dei data center.

I rischi includono possibili ritardi nell’adozione commerciale di nuove architetture, pressioni sui prezzi derivanti dalla concorrenza, problematiche nella catena di fornitura e cambiamenti regolamentari che potrebbero incidere sui modelli di business basati su licenze e royalties.

Per una valutazione completa è consigliabile analizzare i bilanci, le roadmap tecnologiche, le partnership strategiche e le stime di mercato aggregate, oltre a confrontare scenari ottimistici e più conservativi per comprendere l’intervallo di possibili risultati.

Conclusione

La transizione dall’addestramento all’inferenza rappresenta una fase cruciale per l’industria dell’intelligenza artificiale e per l’ecosistema dei semiconduttori. Aziende che forniscono architetture, proprietà intellettuale e soluzioni specializzate potrebbero trovare nuove opportunità di crescita, ma il contesto rimane complesso e richiede un’analisi attenta dei fattori tecnologici, commerciali e regolamentari.



Author: Tony
Redazione Finanza Flash. Notizie di finanza, mercati, borsa e macroeconomia in tempo reale. Aggiornamenti su investimenti, banche, BCE ed economia italiana.