Buon Anno, Signor Presidente !

[1] [2] [3] All’ora in cui tanti si preparano all’aperitivo serale, arriva puntuale, ogni 31 dicembre, il messaggio di fine anno del Presidente della Repubblica. Tradizione nata insieme alla Repubblica (o quasi[4]), il messaggio di fine anno del Presidente ha resistito a tutte le mode ed è sopravvissuto al ricambio tecnologico dei media[5]. Sin dall’inizio si è anche imposto come un vero e proprio format televisivo[6] che riesce ogni anno a radunare milioni di telespettatori[7] nonostante fossero spesso presi dagli ultimi preparativi della festa.

Non interessa interrogarsi in questa sede sull’opportunità o meno di tale appuntamento annuale né, tantomeno, sui motivi che favoriscono o logorano il protrarsi di questo rituale repubblicano[8]. Va semplicemente tratto vantaggio dal fatto che 67 anni di auguri presidenziali di fine anno formano oggi un corpus documentale di sufficiente spessore per diventare oggetto di analisi statistica.

Da oltre un decennio, l’analisi statistica dei documenti scritti è diventata pratica comune e consolidato strumento scientifico (Jockers, 2014; Gries, 2013; Baayen, 2008). Sebbene la statistica sia completamente entrata a far parte del campo degli studi letterari, ben poco è stato finora intrapreso in Italia per indagare la produzione testuale delle Istituzioni con uguale rigore quantitativo. Questo breve articolo punta pertanto a proporre una lettura statistica dei 67 messaggi di fine anno che dal 1949 ad oggi sono stati proposti dai vari Presidenti della Repubblica succedutisi al Quirinale.

1. Stile ed elocuzione

Prima di tutto va notato che non tutti i Presidenti della Repubblica hanno rivolto sette volte gli auguri di fine anno al paese. Luigi Einaudi rimase in carica 6 anni, Antonio Segni 2, Giorgio Napolitano 9 e Sergio Mattarella si è finora sottoposto una sola volta all’esercizio di San Silvestro. Se il numero totale delle parole pronunciate ne risente, il numero medio di parole per discorso fornisce una migliore indicazione sui Presidenti più sobri e quelli più loquaci. Il numero medio di parole per frase invece aiuta a capire lo stile linguistico di ogni Presidente. Quanto al numero medio di parole pronunciate al minuto permette di farsi una valida idea del ritmo e velocità di elocuzione.

 

Presidente Auguri       Totale Parole       Parole per Messaggio       Parole per Frase       Parole per Minuto
Luigi Einaudi 6 1210 202 42 116
Giovanni Gronchi 7 5821 832 46 139
Antonio Segni 2 1797 898 49 126
Giuseppe Saragat 7 8471 1210 32 132
Giovanni Leone 7 7333 1048 29 142
Sandro Pertini 7 14705 2101 19 95
Francesco Cossiga 7 14131 2019 38 115
Oscar Luigi Scalfaro 7 24588 3513 18 110
Carlo Azeglio Ciampi 7 12605 1801 18 99
Giorgio Napolitano 9 20377 2264 30 122
Sergio Mattarella 1 2117 2117 17 106

Vale la pena evidenziare due elementi di rilievo:

  • i mutamenti delle forme stilistiche proprie ad ogni Presidente
  • i cambiamenti nei ritmi di elocuzione di ognuno di loro

1.1. Mutamenti stilistici

Appaiono con grande chiarezza i mutamenti stilistici nel corso della storia dei messaggi di fine anno.[9] Prima di tutto, si nota un accorciamento progressivo del periodo medio, quasi un dimezzamento: dalle circa 42 parole per frase degli anni 1949–1968 a circa 22 parole nei settennati dei Presidenti Ciampi e Scalfaro (con l’eccezione del Presidente Cossiga che usava frasi più lunghe). Ultimamente, il Presidente Napolitano ha invertito la tendenza, proponendo una lingua un pò più sofisticata fondata su periodi di lunghezza decisamente maggiore dei suoi predecessori (circa 28 parole per frase). Infine, nel suo primo messaggio di fine anno, il Presidente Mattarella ha costruito il suo discorso su frasi molto brevi (17–18 parole per periodo in media), taglienti ed a forte impatto, con uno stile più giornalistico che istituzionale (assai simile ai Presidenti Ciampi, Scalfaro e Pertini).

1.2. Evoluzioni elocutorie

L’impatto che ha avuto in questi ultimi decenni il profondo mutamento dell’ecosistema dei media sulle forme di espressione orale e scritta in generale potrebbe portare a pensare che un simile effetto sia stato impresso al ritmo e velocità di elocuzione dei Presidenti. Il progressivo slittamento del media dominante (dalla radio e dai giornali alla tivù all’Internet ai social media) nonché i cambiamenti subiti dai vari format che tendono a privilegiare, sempre di più, forme brevi di comunicazione si sono diffusi in modo così tanto pervasivo in ogni piega della società che è lecito, ed anche spontaneo, ipotizzare una simile trasformazione dell’elocuzione presidenziale che rifletta il passaggio da una concezione sacrale della Presidenza ad una concezione più in linea con lo zeitgeist. In verità, nulla di tutto questo sembra applicarsi ai messaggi presidenziali di fine anno. In effetti, anziché notare un’accelerazione dell’elocuzione si riscontra il contrario: i Presidenti Gronchi, Segni, Saragat e Leone parlavano in modo ben più rapido dei Presidenti Pertini, Cossiga, Scalfaro, Ciampi, Napolitano e Mattarella.[10] [11]

Forse val la pena anche notare un dettaglio: sebbene tutti i Presidenti fossero seduti per pronunciare il messaggio di fine anno, non tutti lo sono stati allo stesso modo. Per la maggior parte dei messaggi, i Presidenti erano seduti alla scrivania; i Presidenti Pertini, Scalfaro e Mattarella usarono talvolta una poltrona in un salotto del Quirinale, senza scrivania[12]; il Presidente Pertini nel 1984 si sedette addirittura di fianco ad un focolare in un ambiente semplice lontano dal formalismo e le dorature quirinalizie. In particolare, nel 2011 e 2012, il Presidente Napolitano si sedette in modo informale alla scrivania, obliquamente (e con la giacca sbottonata nel 2011). In queste due occasioni (2011 e 2012), la media di parole pronunciate al minuto cresce dalle 110 alle 120[13], ad indicare –ma si tratta solo di indicazione di massima il cui orientamento andrebbe seguito negli anni– che mutamenti nella scenografia del messaggio di fine anno possono avere un impatto sulla locuzione.

2. Lunghezza

Benché il settennato del Presidente Scalfaro sia caratterizzato dai messaggi di fine anno di gran lunga più prolissi della storia repubblicana (con addirittura 5.013 parole pronunciate il 31 dicembre 1997), è innegabile una tendenza all’allungamento del messaggio di auguri, da meno di 500 parole in media prima del 1960[14] a mediamente più di 1.500 parole dopo il 1980[15]. Questa tendenza alla crescita, tuttavia, subisce una battuta d’arresto nel 1999–2000 e segna una leggera inversione negli ultimi 15 anni, con messaggi che contano, in gran parte, tra le 1.800 e le 2.250 parole circa.

3. Frequenze

In questo tipo di pubblico discorso che la diffusione televisiva rende fruibile a tutti in una specie di celebrazione, formale e ricorrente, che già nel 1964 il Presidente Saragat definì una “comunione spirituale di tutta la nazione”, la scelta e l’uso dei termini pronunciati dal Presidente non vengono di certo affidati al caso. D’altronde, sin dai primi anni, il messaggio presidenziale di fine anno è stato oggetto di lettura ed analisi nei minimi particolari da parte di giornalisti, analisti e personale politico, oltre ad essere seguito da una audience molto vasta. Interessante pertanto evidenziare le parole e, dietro a loro, le tematiche usate con maggior frequenza dai Presidenti per tentare di delineare la mappa dei temi di rilevanza storica oppure di personale interesse del locutore.

Per l’insieme dei messaggi di fine anno pronunciati da tutti i Presidenti, non stupisce vedere che l’Italia rappresenta il tema centrale e dominante[16], insieme al bilancio consuntivo dell’anno passato e ai suggerimenti, proposte, auspici per l’anno nuovo. La pace e i giovani occupano anche un posto di rilievo negli auguri presidenziali, ma pure politica, Europa, libertà e lavoro sono temi che molti Presidenti hanno affrontato il 31 dicembre.

Lo studio della frequenza assoluta di uso delle parole fornisce chiare indicazioni sull’impostazione complessiva degli auguri presidenziali. Questi appaiono come un momento di unità del paese, vera o auspicata, di raduno attorno a simboli patriottici condivisi e di celebrazione se non di costruzione della narrazione nazionale[17]. Ma non tutti i Presidenti insistono allo stesso modo sugli stessi temi. Aldilà delle convergenze, l’ecosistema lessicale proprio ad ogni Presidente varia notevolmente rispetto alla ‘media’ complessiva illustrando geografie tematiche specifiche e poliedriche. Le nuvole di parole (wordcloud) mettono bene in luce le preoccupazioni personali e le pieghe dell’attualità che trattengono in modo differenziato l’attenzione di questo o quel Presidente.

 

Presidente L. Einaudi Presidente G. Gronchi Presidente A. Segni
Presidente G. Saragat Presidente G. Leone Presidente S. Pertini
Presidente F. Cossiga Presidente O. L. Scalfaro Presidente C. A. Ciampi
Presidente G. Napolitano Presidente S. Mattarella

 

4. Associazioni di parole

Fondamentale nell’analisi dei contenuti in linguaggio naturale[18] è l’individuazione di strutture di associazione, ovvero parole che vengono spesso usate insieme, in coppia (bigrammi) o in strutture più lunghe (3, 4 o più parole).

Oltre alle espressioni ovvie e di circostanza in questo esercizio di fine anno (quali sono, per esempio, ‘buon anno’, ‘nuovo anno’, ‘quest anno’) e ai riferimenti alla nazione (‘popolo italiano’, ‘unita nazionale’, ‘bene comune’, ‘carta costituzionale’), può destare qualche sorpresa vedere figurare espressioni per lo meno inattese tra le più citate. Difficile, per esempio, rendersi conto senza un’analisi quantitativa del linguaggio quanto questi messaggi siano autoreferenziali con una forte ricorrenza di espressioni quali ‘presidente repubblica’[19], ‘capo stato’, ‘vorrei dire’, oppure quanto ‘forze armate’ e ‘forze ordine’ siano presenti nei messaggi di auguri. Inoltre, sia l’analisi dei bi-grammi che dei tri-grammi toglie ogni dubbio, se ce ne fosse ancora bisogno, sui temi di massima centralità per l’Italia in questi quasi settantanni di storia contemporanea. ‘Unione europea’, ‘nazioni unite’, ‘comunita internazionale’ e ‘medio oriente’ ricordano l’inserimento del Paese nella rete dei rapporti internazionali ma anche dei problemi geo-politici su larga scala. Allo stesso modo, espressioni del tipo ‘giustizia sociale’, ‘economico sociale’, ‘debito pubblico’ o ‘criminalita organizzata’ ci riportano a problemi interni che hanno segnato la storia recente del paese. Infine, ci si può ragionevolmente chiedere se la presenza di ‘giovanni paolo’ e ‘paolo ii’ tra i bi-grammi più usati non suggerisca la prossimità –forse ancor più spirituale che geografica– tra il Quirinale e il Vaticano. D’altronde, nell’arco dei 67 anni, il tri-gramma ‘aiuto di dio’ compare più volte di ‘posti di lavoro’…

A titolo puramente esemplificativo, viene riportata una lista parziale e selettiva di tri-grammi[20] citati almeno 10 volte.

 

Frequenza di uso TriGramma
45 forze dell ordine
44 capo dello stato
43 il popolo italiano
36 del nostro paese
36 per la pace
25 presidente della repubblica
24 tutti gli italiani
24 tutti i cittadini
21 senso di responsabilità
19 la libertà e
16 il capo dello
14 il mio pensiero
14 le forze politiche
13 contro il terrorismo
13 economico e sociale
13 giovanni paolo ii
13 presidente del consiglio
12 della nostra società
12 il bene comune
11 aiuto di dio
11 pace nel mondo
11 per la giustizia
10 dell unione europea
10 della persona umana
10 delle nazioni unite
10 posti di lavoro

5. Tematiche

Come abbiamo già visto, il periodo storico, gli avvenimenti maggiori, nazionali o internazionali, le problematiche di rilievo, le emergenze affrontate dalle Istituzioni o dalla popolazione, i particolari centri di interesse di ogni Presidente hanno un notevole impatto sulla scelta della terminologia adottata nei messaggi di auguri di fine anno. Per illustrare questo fenomeno di selezione ci limiteremo a pochi esempi relativi a sette temi specifici.[21]

  • disoccupazione
  • lavoro e lavoratori
  • giovani
  • cultura
  • terrorismo e terrore
  • riforme
  • patria[22]

Presentati in forma grafica (nei grafici intitolati Numero di Evocazioni del Tema in Ogni Messaggio) si percepisce meglio, e comunque in modo più immediato, quando, e quanto, un tema specifico sia stato evocato nella lunga catena dei 67 messaggi di fine anno. Ogni grafico fotografa un tema e indica il numero di volte che quel tema è stato citato, in assoluto, in ogni particolare messaggio. Per esempio, nel primo grafico relativo alla disoccupazione, si vede che il termine è stato usato ben sei volte nel messaggio di fine anno del 1984 (Presidente Sandro Pertini).

Questo, tuttavia, rappresenta solo la metà dell’analisi. La pregnanza di un tema non si misura solo dalla frequenza assoluta dei termini rilevanti nei singoli messaggi bensì anche dalla frequenza relativa del termine nel messaggio paragonata alla media di uso dello stesso termine nella lingua italiana in generale nel medesimo periodo storico o anno.[23]

5.1. Disoccupazione

5.2. Lavoro e lavoratori

5.3. Giovani

5.4. Cultura

5.5. Terrorismo e terrore

5.6. Riforme

5.7. Patria

 

E’ utile sottolineare che in ognuno di questi sette casi, la differenza di frequenza relativa d’uso del tema (lemma) tra la lingua italiana in generale (in quegli anni) e i messaggi di fine anno dei Presidenti non è dovuta al caso. Il t-test di indipendenza[24] ha ottenuto un valore p sempre inferiore a 0,001.

Da questo tipo di analisi si può verificare, per esempio, che il tema del terrorismo occupa un posto di notevole rilevanza per il Presidente Pertini –sicuramente perché il suo settennato fu, da questo punto di vista, un periodo difficile e tragico per l’Italia–, così come furono per lui anche centrali le questioni della disoccupazione e dei giovani. Ma si nota anche che, complessivamente, per i nostri Presidenti, il terrorismo è iscritto nella nostra memoria storica come un fenomeno legato tanto –se non di più– alla fine degli anni 70 e inizi 80 quanto agli episodi di questi ultimi 10–15 anni, dal 2001 in avanti. Il Presidente Napolitano, invece, sembra essere stato preoccupato non solo dal tema del lavoro ma anche e soprattutto dalla problematica delle riforme allorché fa riferimento alla patria solo 4 volte in 9 anni; tema che, invece, fu molto caro ai Presidenti Ciampi e Scalfaro. La cultura, dal canto suo, ha attratto prevalentemente l’attenzione dei Presidenti Cossiga e Scalfaro. Andrebbe però ulteriormente approfondita l’analisi statistica per capire se intendessero cultura nel senso antropologico oppure artistico.

Una volta stabilito l’algoritmo, questo tipo di analisi ha il vantaggio di poter essere allargato a qualsiasi tema, offrendo una lettura storica radicata nella realtà di dati quantificati e non solo nell’ispirazione del ricercatore. Sarebbe sicuramente istruttivo a più di un titolo il confronto tra l’analisi socio-politica “tradizionale” e la rilettura statistica dei dati su temi come, per esempio, il meridione, le mafie, i flussi migratori, l’innovazione, per citarne solo alcuni.

6. Analisi dei sentimenti

L’analisi statistica dei sentimenti[25] si sviluppa sulla base di un insieme di metodologie finalizzate alla misurazione, quantificazione e classificazione di opinioni e sentimenti espressi in documenti (e corpus testuali) tramite l’uso di parole e termini semanticamente e semiologicamente marcati. Per esempio, in funzione della composizione lessicale del testo, la frase “Lo scorso trimestre l’economia europea ha tratto profitto del prezzo favorevole del petrolio” verrebbe classificata come positiva, allorché risulterebbe negativa la frase “Nello stesso periodo il mercato del lavoro ha continuato a soffrire, penalizzando in particolare i giovani.” In questi ultimissimi anni, lo sviluppo della disciplina ha conosciuto una forte accelerazione consecutiva al desiderio di capire meglio l’evoluzione di vari tipi di contenuti pubblicati da centinaia di milioni di utenti sui social media (nonostante le difficoltà dovute al rilevamento automatico di sentimenti in testi brevi. Thelwall, 2010) e gli innumerevoli siti web che offrono all’utente la possibilità di recensire prodotti e servizi (Galitsky, 2009; Cataldi and al., 2013).

Solitamente usata a scopo scientifico[26] ma anche economico-commerciale[27], la sentiment analysis applicata a documenti storici, amministrativi o istituzionali rimane ancora embrionale, soprattutto per documenti in lingua italiana.[28] Di conseguenza, chiedersi se la “verità” dei messaggi di fine anno dei Presidenti della Repubblica non risieda tanto nei dati sottostanti quanto nell’analisi politica tradizionale può solo stimolare un filone innovativo di ricerca e innescare riflessioni radicate nell’estensione delle data sciences allo studio delle Istituzioni.

Il primo passo per svolgere la sentiment analysis dei messaggi presidenziali è consistito nella riduzione di complessità lessicale per mezzo della lemmizzazione del testo, ovvero la sostituzione di ogni termine usato con il suo lemma di riferimento. Per esempio, l’ultima frase del primo messaggio di fine anno del Presidente Einaudi nel 1949, da “tale sono sicuro è il comune voto e tale è il mio personale augurio che si rivolge fervido e affettuoso in quest ora ad ogni italiano entro e fuori dei confini della patria” diventa “tale essere sicuro essere il comune voto e tale essere il mio personale augurio che si rivolgere fervido e affettuoso in questo ora ad ogni italiano entro e fuori del confine del patria”. Questo consente una più facile gestione dei dizionari di parole che, tra varie semplificazioni, non necessitano di includere tutte le forme coniugate di ogni verbo bensì possono limitarsi a citare la sola forma infinitiva. Per una sentiment analysis di base e senza sofisticazioni, una volta lemmizzati i messaggi, a ogni termine (lemma) viene associato un valore positivo unico (+1) se il termine esprime un sentimento, opinione, atteggiamento, concetto positivo, un valore negativo unico (–1) se il lemma traduce un sentimento, opinione, atteggiamento, concetto negativo e un valore neutro (0) per i termini neutri (Vryniotis, 2013).[29] Dopo aver sommato i valori delle singole parole raggruppate per frase, ogni frase di ogni messaggio presidenziale può essere caratterizzata da 3 valori assoluti: la somma dei “sentimenti positivi” (espressa in un numero intero sempre positivo), la somma dei “sentimenti negativi” (espressa in un numero intero sempre negativo), la somma complessiva dei “sentimenti” espressi in quella frase (tradotta in un numero intero positivo o negativo a seconda dei sentimenti dominanti).

La distribuzione dei valori di somma complessiva di sentimento dimostra che i messaggi di fine anno veicolano concetti, opinioni, sentimenti, apprezzamenti prevalentemente positivi. Dal 1949 a oggi, ogni frase dei messaggi si colloca infatti sulla sezione positiva della scala, con un valore medio di 3,7 e un valore mediano di 3.

Tuttavia, per una maggiore accuratezza, questi valori interi (somma positiva, somma negativa e somma complessiva) vanno ponderati rapportandoli al numero totale di parole nella frase. Si ottengono così 3 valori percentuali (sentimenti positivi, negativi e percentuale complessiva). Aggregando i valori delle singoli frasi per messaggio e, successivamente, raggruppando i messaggi per presidente, si perde in granularità ma si acquisisce una visione d’insieme più immediata ed esplicita (in modo particolare se si usa una funzione polinomiale per “levigare” le asperità del valore complessivo).

Per esempio, il messaggio di fine anno 2015 del Presidente Mattarella appare prevalentemente positivo nonostante siano presenti dichiarazioni spiccatamente negative.[30]

La sentiment analysis –che forse andrebbe chiamata opinion mining in questo caso– aiuta anche ad esplicitare eventuali strutture di costruzione della narrazione, e magari capire come è stata trattata l’argomentazione da parte del locutore.

I due grafici successivi illustrano i messaggi di fine anno pronunciati dal Presidente Napolitano nel 2007 e 2011. Si osserva una somiglianza della struttura narrativa: dopo gli auguri iniziali (che si traducono con un indice di sentimento alto), il Presidente evoca fatti, pensieri, opinioni, situazioni negativi (ciò fa notevolmente diminuire l’indice complessivo) per poi segnare un gran colpo esprimendo di nuovo sentimenti, opinioni chiaramente positivi che lentamente si “affievoliscono” fino agli auguri finali. In altre parole: dopo una partenza in quarta, arrivano subito le brutte notizie che sono immediatamente controbilanciate, prima da poche ma forti opinioni molto positive, poi da una lunga serie di espressioni ancora positive, fino alla conclusione del messaggio che alimenta una spiccata speranza per l’anno a venire.

Anche l’analisi di lungo termine sui dati aggregati per messaggio riesce a trarre beneficio da questo approccio. Complessivamente, il livello di sentimento positivo espresso nei messaggi di fine anno da tutti i Presidenti varia assai poco. Nonostante si riscontrino oscillazioni più marcate di anno in anno (con un campo di variazione massima negli anni compreso tra il +28.5% del 2003 e il +16.8% del 1981), la tendenza globale rimane stabile –relativa stabilità nel tempo sicuramente dovuta, almeno in parte, alle specificità di questo particolare esercizio di comunicazione che tende ad evidenziare la dimensione degli auguri e auspici positivi che vengono d’altronde ripetuti più volte nell’arco del messaggio.

Cresce, invece, in tendenza, la proporzione di sentimento negativo nel corso degli anni, ma con oscillazioni che sembrano[31] seguire le evoluzioni delle crisi economiche e sociali. Si osserva, in effetti, un rapido degrado dei sentimenti espressi tra il 1959 e il 1980–1981 (circa un raddoppiamento dei lemmi negativi), seguito da una levimento del pessimismo dal 1981 al 2000 e di nuovo un progressivo oscuramento dei cieli dal 2001–2002 in avanti.

L’espressione dei sentimenti considerata per ogni singolo presidente testimonia di una certa variabilità, con il Presidente Sandro Pertini che, fino ad oggi, si colloca agli estremi sia per la più alta percentuale dei sentimenti (lemmi) marcati negativamente che per la più bassa percentuale di quelli marcati positivamente. Aldilà delle differenze di personalità, il periodo storico avrà sicuramente influito sul volume del flusso di sentimenti negativi espressi dai Presidenti Leone e Pertini. Per questo stesso motivo, sarà utile guardare da vicino ai prossimi messaggi di fine anno per capire se il ricorrere a sentimenti negativi da parte del Presidente Mattarella conferma una tendenza che sembra inaugurarsi con il Presidente Napolitano oppure se si tratta solo di un caso dovuto al fatto che finora il Presidente Mattarella ha avuto un’unica occasione di fare gli auguri di fine anno alla nazione.


Bibliografia

Baayen, R.H., (2008). Analyzing Linguistic Data, Cambridge University Press.

Baccianella, S., Esuli, A. and Sebastiani, F. (2010). “Sentiwordnet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining”, in Calzolari, N. and al., editor, Proceedings of LREC, 2200–2204. http://is.gd/VLTKqB

Basile, V. and Nissim, M. (14 June 2013). “Sentiment analysis on Italian tweets”, Proceedings of the 4th Workshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis, 100–107. http://is.gd/io82rB

Casotto, P. (2012). Sentiment Analysis for the Italian Language, Tesi di Dottorato, Dipartimento di matematica e Informatica, Universita’ degli Studi di Udine.

Cataldi, M., Ballatore, A., Tiddi, I., Aufaure, M.-A. (22 June 2013). “Good location, terrible food: detecting feature sentiment in user-generated reviews”, Social Network Analysis and Mining, 3 (4): 1149–1163. http://is.gd/Tlp0Fc

Charpentier, A. (22 February 2016). “Clusters of Texts”, Freakonometrics. http://is.gd/32mB13

Davidov, D., Tsur, O, and Rappoport, A. (2010). “Enhanced sentiment learning using twitter hashtags and smileys”, Proceedings of the 23rd International Conference on Computational Linguistics, COLING ’10, 241–249, Stroudsburg, PA, USA.

Galitsky, B. and McKenna, E.W. (12 November 2009). “Sentiment Extraction from Consumer Reviews for Providing Product Recommendations”, Patent US–20090282019-A1. http://is.gd/ioVBsb

Gonzales-Ibanez, R., Muresan, S. and Wacholder, N. (June 2011). “Identifying sarcasm in twitter: A closer look”, Proceedings of the 49th Annual Meet- ing of the Association for Computational Linguistics: Human Language Technologies, 581–586, Portland, OR, USA.

Gries, S.Th. (2013). Statistics for Linguistics with R, Second Edition, De Gruyter Mouton, Berlin.

Jockers, M.L., (2014). Text Analysis with R for Students of Literature, Springer.

Kennette, L.N., Wurm, L.H. and Van Havermaet, L.R. (2010). “Change detection: The effects of linguistic focus, hierarchical word level and proficiency”, The Mental Lexicon, 5(1), 47–86.

Kulkarni V., Rfou R., Perozzi B. and Skiena S. (2015). “Statistically Significant Detection of Linguistic Change”, Proceedings of the 24th International Conference on World Wide Web, 2015.

Lebeau, J. (20 January 2016). “State of the Union Speeches and Data”, More or Less Numbers. http://is.gd/NrJIRS

Liu, B. (2012). Sentiment Analysis and Opinion Mining, Synthesis Lectures on Human Language Technologies, Morgan & Claypool Publishers.

Lapowsky, I. (13 January 2016). “The True Message of the State of the Union Is in the Data”, WIRED. http://is.gd/7ULEdC

Mani, I. (2010). The Imagined Moment. Time, Narrative, and Computation, University of Nebraska Press.

Mejova, Y. (16 November 2009). “Sentiment Analysis: An Overview”. http://is.gd/C1U9OJ

Taboada, M., Brooke, J., Tofiloski, M., Voll, K. and Stede, M. (June 2011). “Lexicon-based methods for sentiment analysis”, Comput. Linguist., 37(2):267–307.

Thelwall, M., Buckley, K., Paltoglou, G., Cai, D., Kappas, A, (2010). “Sentiment strength detection in short informal text”, Journal of the American Society for Information Science and Technology, 61 (12): 2544–2558. http://is.gd/yRnRCq

Vryniotis, V. (23 September 2013). “The importance of Neutral Class in Sentiment Analysis”, Machine Learning Blog & Software Development News. http://is.gd/FidS0k


Note

[1] Questo documento è il risultato di un’analisi svolta dall’autore e rispecchia solo ed esclusivamente le posizioni dell’autore. Pertanto, questo documento non coinvolge in nessun modo, né direttamente, né indirettamente, nessuno dei datori di lavoro, passati e presente, dell’autore. L’Autore conferma di non avere nessun conflitto di interessi, di non aver mai lavorato, né in modo remunerato né a titolo gratuito, per la Presidenza della Repubblica, e di non aver mai ricevuto incarichi di nessun tipo dal Quirinale. L’Autore porta a conoscenza dei lettori di essere stato insignito Commendatore dal Presidente della Repubblica con Decreto del 01 Agosto 2007.

[2] eMail: salvino [dot] salvaggio [at] gmail [dot] com

[3] L’Autore ringrazia Paolo Barbesino, Paolo Gasparini, Gaetano Palumbo per i commenti alle precedenti versioni.

[4] Il primo messaggio di fine anno fu del Presidente Luigi Einaudi il 31 dicembre 1948. L’On. Enrico de Nicola –eletto Presidente provvisorio il 28 giugno 1946, poi di nuovo il 26 giugno 1947 in seguito alle sue dimissioni, e di nuovo Presidente della Repubblica dal 1 gennaio 1948– non fece nessun augurio alla nazione nei suoi due 31 dicembre al Quirinale.

[5] Carta stampata, diffusione radiofonica e film dell’Istituto Luce nei primissimi anni, diretta televisiva dal 1954 in avanti.

[6] Infatti, sin dalla sua prima comparsa in TV nel 1954, la trasmissione spesso si apre con un campo largo che riprende una stanza del Quirinale per poi stringere progressivamente l’inquadratura sul busto e il viso del Presidente che parla alla nazione guardando direttamente la telecamera.

[7] Record detenuto dal Presidente Giorgio Napolitano seguito da circa 13 milioni di telespettatori il 31 dicembre 2014.

[8] Un rituale molto formalizzato, con poche sorprese o variazioni formali ma anche sostanziali, come dimostra il text clustering che non riesce ad isolare gruppi chiari o specifici (Charpentier, 2016).

[9] Evidenziato da change point detection per individuare non solo uno o più eventuali cambiamenti ma anche il momento in cui avvengono (Kulkarni and al, 2015; Kennette and al, 2010.

[10] La variazione rispetto alla media é statisticamente significativa e non può pertanto essere attribuita al caso (t-test).]

[11] Sarebbe utile –ma il dato purtroppo non è disponibile– conoscere le velocità medie di elocuzione della popolazione italiana in generale, anno per anno, dal 1949 in avanti per paragonare ai dati dei messaggi presidenziali.

[12] Non è chiaro tuttavia se il Presidente Scalfaro fosse o meno al Quirinale per il messaggio del 31 dicembre 1997.

[13] p-value del t-test di circa 0.00016, quindi non attribuibile al caso.

[14] Per l’esattezza 481,8 parole.

[15] Con la notevole eccezione del 1991, anno in cui il Presidente Cossiga andò in TV a fare gli auguri per dire sostanzialmente che non avrebbe detto altro, il tutto in sole 419 parole in meno di 4 minuti. Va segnalato che, da un punto di vista statistico, sono proprio i messaggi dei Presidenti Pertini e Scalfaro ad imprimere la più forte crescita alla tendenza generale (regressione).

[16] I termini “Italia”, “italiani”, “italiane” vengono pronunciati quasi 700 volte in 67 messaggi.

[17] Con parole come, italia, italiani, giovani, popolo, paese, vita, libertà, cittadini, democrazia, fiducia, responsabilità.

[18] Natural Language Processing (NPL).

[19] Che nell’analisi statistica sta per ‘presidente della repubblica’.

[20] Ottenuti con il software AntCon 3.4.3.

[21] I temi sono stati scelti senza prestesa di rappresentatività.

[22] Sono stati usati i seguenti termini o espressioni regex nella ricerca delle occorrenze: ‘disoccupa|sottocupa’, ‘lavor’, ‘cultur’, ‘terror’, ‘riform’, ‘\bpatri(a|ota|oti|otti)’, ‘\bgiov(ani|ane|entù|anile|anili|inezza|anezza)\b’

[23] Questa seconda analisi è resa possibile da Google Books che mette a disposizione dei ricercatori le frequenze di tutte le parole usate in milioni di libri, anno per anno, lingua per lingua, dal 1500 circa al 2009. Va sottolineato che la quantificazione terminologica del corpus linguistico semantico costruito da Google Books non include i testi pubblicati nei media (giornali, Internet) che forse modificherebbero i dati di frequenza aggiungendo una componente di attualità più marcata.

[24] Metodo Welch.

[25] Solitamente chiamata sentiment analysis oppure opinion mining. Vedi Mejova, 2009 per una descrizione complessiva.

[26] Per esempio per aggiungere spessore quantitativo all’analisi letteraria, oppure in ambito politico per meglio capire le evoluzioni degli orientamenti dell’elettorato.

[27] Per valutare il livello di adesione a messaggi pubblicitari o a specifiche marche.

[28] La facile reperibilità di molteplici dizionari inglesi di parole associate a valenze di vari sentimenti e opinioni ha dinamizzato le ricerche su contenuti in lingua inglese (Baccianella et al., 2010; Gonzales-Ibanes and al., 2011; Liu, 2012). Lo stesso stà succedendo per lo spagnolo e, in minor misura, per altre lingue. In Italiano, purtroppo, la disponibilità di tali strumenti soffre ancora notevoli carenze e gli sforzi lodevoli di ricercatori isolati non bastano a colmare il doppio deficit di, da un lato, liste di parole con la corrispondente quantificazione della connotazione positiva o negativa e, dall’altro, di classificazioni delle stesse parole per tipologia di sentimento o opinione. Disporre di un dizionario di base che segnali la valenza positiva (+1) o negativa (–1) di un aggettivo è un primo passo fondamentale per questo approccio. Ma sapere anche se lo stesso aggettivo appartiene a una specifica categoria di sentimento –per esempio rabbia, gioia, tristezza, paura, sorpresa, fiducia, ecc.– consente di arricchire l’analisi. In Italiano, vedi per esempio il software sentiment-italian-lang di Giuseppe Ragusa – https://github.com/gragusa?tab=repositories, Casotto, P. (2012), Basile and Nissim (2013).

[29] Per una maggiore sofisticazione, i lemmi possono essere quantificati su una scala reale che include i valori intermedi tra 0 e 1, 0 e –1.

[30] In questo tipo di grafico, l’ordine di successione delle frasi nel discorso fa da asse temporale (ascissa) –questo approccio viene solitamente definito come novelistic time (Mani, 2010).

[31] La cosa andrebbe verificata nel dettaglio.