Analizzare i bilanci, prevedere l’aumento degli utili e decidere se comprare o vendere azioni: il lavoro dell’analista finanziario non è mai stato facile. Spesso, il famoso “consenso” sbaglia previsioni, offrendo poche soddisfazioni a chi opera sui mercati. ChatGpt potrebbe migliorare le performance degli analisti, secondo un nuovo studio della Chicago Booth School of Business. Addestrato con i prompt adeguati, ChatGpt 4.0 Turbo ha previsto correttamente la direzione futura degli utili nel 60% dei casi, rispetto al 53% degli analisti umani. Questa differenza è notevole, poiché innalza le chance molto al di sopra del proverbiale lancio della monetina. Infatti, utilizzando le previsioni di ChatGpt per costruire un portafoglio equal weighted, si ottiene una performance aggiuntiva (alfa) del 10% annuo, secondo i ricercatori. Un rendimento aggiuntivo che risulta superiore anche se corretto per il rischio, grazie a un Sharpe ratio superiore rispetto a quello dei portafogli costruiti dagli algoritmi di machine learning già utilizzati nell’industria finanziaria.
“Anche senza alcuna narrazione o informazioni specifiche del settore, il modello di linguaggio supera gli analisti finanziari nella capacità di prevedere i cambiamenti degli utili”, hanno affermato gli autori, sottolineando come questa capacità si riveli soprattutto nelle società più piccole e nelle situazioni in cui la direzione finanziaria dell’azienda appare meno evidente. “Le nostre strategie di trading basate sulle previsioni di Gpt producono un rapporto Sharpe e alfa più alti rispetto alle strategie basate su altri modelli”, si legge, “i nostri risultati suggeriscono che i modelli linguistici potrebbero assumere un ruolo centrale nel processo decisionale”.
ChatGpt batte gli analisti finanziari
L’obiettivo dei ricercatori è stato esaminare le capacità di ChatGpt 4.0 Turbo sulla base dei soli dati di bilancio, evitando di fornire informazioni aggiuntive, contesti narrativi e altre informazioni testuali come “la discussione e l’analisi della direzione aziendale che tipicamente accompagna i bilanci”. Il campione utilizzato per valutare le previsioni degli analisti umani copre il periodo dal 1983 al 2021, comprendendo 39.533 osservazioni su 3.152 aziende. L’esercizio è consistito nel fornire ai modelli di linguaggio gli stessi bilanci e confrontare le attese direzionali sugli utili futuri. Il riferimento di confronto per la parte umana del confronto è stato ricavato dalla mediana delle previsioni individuali degli analisti emesse nel mese successivo al rilascio dei bilanci, considerata ai fini dello studio come “l’aspettativa per gli utili dell’anno successivo”.
Per formulare le sue previsioni, ChatGpt non ha avuto accesso alle informazioni testuali disponibili agli analisti umani. Tuttavia, per ottimizzare la sua analisi, i ricercatori hanno sviluppato un comando “Chain-of-Thought” (CoT) che insegna al modello a imitare un analista finanziario. Questi prompt permettono di individuare tendenze nelle voci di bilancio e calcolare i principali rapporti finanziari, come l’efficienza operativa, la liquidità e il rapporto di leva finanziaria. Secondo gli autori, “il prompt CoT implementa questo processo di pensiero tramite una serie di istruzioni che portano alla determinazione di un aumento o una diminuzione degli utili dell’anno successivo rispetto all’anno corrente”. Mettere i prompt giusti è stato decisivo per la vittoria di ChatGpt, poiché senza queste accortezze l’affidabilità delle previsioni scende dal 60 al 52%, un punto in meno rispetto a quelle umane. Inoltre, le prestazioni calano di molto se si utilizza la vecchia versione di ChatGpt 3.5, mentre la versione Plus di Gemini, l’AI sviluppata da Google, ha generato risultati simili a quelli di Gpt 4.0 Turbo.
“Intuitivamente, gli analisti umani possono fare affidamento su informazioni qualitative o su un contesto più ampio non disponibile per il modello e quindi aggiungere valore. In effetti, abbiamo scoperto che le previsioni degli analisti contengono intuizioni utili sulle prestazioni future non catturate da Gpt”, si legge nel paper. D’altro canto, “nei casi in cui le previsioni umane non incorporano le informazioni in modo razionale, le previsioni di Gpt sono più utili nel prevedere la direzione degli utili futuri”.
L’utilizzo operativo delle previsioni di ChatGpt
L’utilizzo degli algoritmi nella pratica finanziaria è tutt’altro che una novità. Anche se ChatGpt è stato creato senza lo specifico obiettivo di fornire un’elaborazione operativa per le decisioni finanziarie, lo studio della Chicago Booth School of Business ha mostrato la sua superiorità anche a questo scopo. “La strategia long-short basata sulle previsioni di Gpt supera il mercato e genera alfa e rapporti Sharpe significativi”, hanno dichiarato gli autori “l’alfa generato nel modello Fama-French a tre fattori supera il 12% annuo”.
“I modelli di linguaggio possono rilevare modelli e tendenze nel mercato che potrebbero non essere immediatamente evidenti agli analisti umani”, hanno concluso gli autori, “incorporando le previsioni nei modelli di trading algoritmici, gli investitori possono potenzialmente ottenere rendimenti più elevati e rischi inferiori“.