MINISTERO DELL'ISTRUZIONE, DELL'UNIVERSITÀ E DELLA RICERCA
DIPARTIMENTO PER LA PROGRAMMAZIONE IL COORDINAMENTO E GLI AFFARI ECONOMICI - SAUS
PROGRAMMI DI RICERCA SCIENTIFICA DI RILEVANTE INTERESSE NAZIONALE
RICHIESTA DI COFINANZIAMENTO (DM n. 21 del 20 febbraio 2003)

PROGETTO DI UNA UNITÀ DI RICERCA - MODELLO B
Anno 2003 - prot. 2003131041_001
PARTE I

1.1 Tipologia del programma di ricerca
Interuniversitario 


Aree scientifico disciplinari
Area 13: Scienze economiche e statistiche (100%) 
 
 

1.2 Durata del Programma di Ricerca

 

24 Mesi  

1.3 Coordinatore Scientifico del Programma di Ricerca

BATTAGLIA  FRANCESCO  francesco.battaglia@uniroma1.it 
SECS-S/01 - Statistica     
Università degli Studi di ROMA "La Sapienza"     
Facoltà di SCIENZE STATISTICHE     
Dipartimento di STATISTICA,PROBABILITA' E STATISTICHE APPLICATE     

1.4 Responsabile Scientifico dell'Unità di Ricerca

BATTAGLIA  FRANCESCO   
Professore Ordinario  22/06/1952  BTTFNC52H22G702X 
SECS-S/01 - Statistica     
Università degli Studi di ROMA "La Sapienza"     
Facoltà di SCIENZE STATISTICHE     
Dipartimento di STATISTICA,PROBABILITA' E STATISTICHE APPLICATE     
06/49910440
(Prefisso e telefono)
 
06/4959241
(Numero fax)
 
francesco.battaglia@uniroma1.it
(Email)
 

1.5 Curriculum scientifico del Responsabile Scientifico dell'Unità di Ricerca


Testo italiano

Assistente e poi Professore associato presso la Fac. di Sc. Statistiche dell'Univ. di Roma (1978-86). Dal 1986 professore di I fascia nell'Univ. di Cagliari, poi nella Scuola Superiore di Pubblica Amministrazione, Roma e dal 1990 nell'Univ. La Sapienza di Roma. Attualmente titolare di Analisi Statistica Multivariata e di Analisi delle Serie Storiche presso la Fac. di Sc. Statistiche. Incaricato presso la Scuola di Perfezionamento in Ricerca Operativa e Strategie Decisionali dell'Univ. La Sapienza di Roma, in vari anni, di corsi di Teoria delle Decisioni, Inferenza Statistica, Modelli Stocastici, Serie Storiche.
Referee per varie riviste nazionali e internazionali, reviewer per Mathematical Reviews, membro dell'advisory board della collana di Statistica della Springer Verlag Italia. Associate Editor di Statistical Methods and Applications - Journal of the Italian Statistical Society.
E' stato coordinatore di una unità locale in 5 ricerche di interesse nazionale finanziate da Mpi e Murst dal 1982 in poi e coordinatore nazionale nelle ricerche: "Modelli statistici per l'analisi delle serie temporali" cofinanziata dal Murst 1998; "Modelli stocastici e metodi di simulazione per l'analisi dei dati dipendenti", cofinanziata dal Murst 2000; Progetto coordinato "Modelli statistici di serie temporali per la previsione", cofinanziato dal CNR anno 2000.
Gli interessi scientifici principali sono nell'analisi delle serie storiche, nella teoria delle decisioni, nei modelli stocastici applicati all'idrologia e ai fenomeni economici e sociali.


Testo inglese
Formerly assistant and associate professor with the Fac. of Statistics of the Univ. of Rome (1978-86). Full professor since 1986 in the Univ. of Cagliari, later at Scuola Superiore di Pubblica Amministrazione, Rome and since 1990 at the Univ. La Sapienza of Rome. Now professor of Multivariate Statistical Analysis and Time Series Analysis in the Fac. of Statistics. Has taught, around several years, Decision Theory, Statistical Inference, Stochastic Models, Time Series at the Scuola di Perfezionamento in Operations Research and Decision Strategies in the Univ. of Rome.
Referee for several italian and international journals, reviewer for Mathematical Reviews, member of the advisory board of the Series in Statistics of Springer Verlag Italy. Associate Editor of Statistical Methods and Applications - Journal of the Italian Statistical Society.
Served as local coordinator in 5 national research projects funded by Murst (formerly Mpi) from 1982 on and as national coordinator in the researchs: "Statistical models for time series analysis" co-funded by Murst 1998; "Stochastic models and simulation methods for the analysis of dependent data", co-funded by Murst 2000; "Statistical time series models for forecasting", co-funded by C.N.R. 2000.
Main scientific interests: times series analysis, decision theory, applied stochastic models in hydrology, economics and social sciences.

1.6 Pubblicazioni scientifiche più significative del Responsabile Scientifico dell'Unità di Ricerca

 

1. BATTAGLIA F.; L. FENGA (2003). Forecasting composite indicators with anticipated information: an application to the industrial production index APPLIED STATISTICS. (vol. 52 part 3)  
2. R. BARAGONA; BATTAGLIA F.; D. CUCINA (2002). A note on estimating autoregressive exponential models QUADERNI DI STATISTICA. (vol. 4)  
3. BATTAGLIA F. (2001). Genetic algorithms, pseudo random numbers generators and Markov Chain Monte Carlo methods METRON. (vol. LIX n. 1-2 pp. 131-155) presentato al Convegno SCO99, Venezia 1999.  
4. BARAGONA R.; BATTAGLIA F.; CALZINI C. (2001). Genetic algorithms for the identification of additive and innovation outliers in time series COMPUTATIONAL STATISTICS & DATA ANALYSIS. (vol. 37 n.1 pp. 1-12)  
5. BARAGONA R.; BATTAGLIA F. (2000). Some applications of genetic algorithms to statistical inference ATTI DELLA RIUN. SCIENTIFICA DELLA SOC. ITAL, DI STATISTICA, FIRENZE 2000. (pp. 329- 340)  

1.7.1 Personale universitario dell'Università sede dell'Unità di Ricerca

Personale docente

Cognome  Nome  Dipartimento   Qualifica  Settore Disc.  Mesi Uomo 
1° anno  2° anno 
1. BATTAGLIA   Francesco   Dip. STATISTICA,PROBABILITA' E STATISTICHE APPLICATE   Prof. Ordinario   SECS-S/01   9   9  
2. ORSINGHER   Enzo   Dip. STATISTICA,PROBABILITA' E STATISTICHE APPLICATE   Prof. Ordinario   MAT/06   5   5  
3. FACHIN   Stefano   Dip. CONTABILITA' NAZIONALE ED ANALISI DEI PROCESSI SOCIALI   Prof. Ordinario   SECS-S/03   6   6  
4. BARAGONA   Roberto   Dip. SOCIOLOGIA E COMUNICAZIONE   Prof. Ordinario   SECS-S/01   6   6  
5. BOCCI   Laura   Dip. SOCIOLOGIA E COMUNICAZIONE   Ricercatore Universitario   SECS-S/01   7   6  
                 33  32 


Altro personale


Nessuno

1.7.2 Personale universitario di altre Università

Personale docente
Nessuno

Altro personale


Nessuno

1.7.3 Titolari di assegni di ricerca

Cognome  Nome  Dipartimento/Istituto  Data di inizio del contratto  Data fine contratto  Mesi Uomo 
1° anno  2° anno 
1. BEGHIN   Luisa   Dip. STATISTICA,PROBABILITA' E STATISTICHE APPL.  01/01/2001   31/12/2003   3   3  
                

1.7.4 Titolari di borse per Dottorati di Ricerca e ex L. 398/89 art.4 (post-dottorato e specializzazione)

Cognome  Nome  Dipartimento/Istituto  Anno del titolo  Mesi Uomo 
1° anno  2° anno 
1. Pandolfo  Giuseppe  Dip. STATISTICA,PROBABILITA' E STATISTICHE APPL.   2006  3   3  
             

1.7.5 Personale a contratto da destinare a questo specifico programma

Qualifica  Costo previsto  Mesi Uomo 
1° anno  2° anno 
laureato  10.000  6   6  
tecnico informatico  4.000    5  
   14.000  11 

1.7.6 Personale extrauniversitario dipendente da altri Enti

Cognome  Nome  Nome dell'ente  Qualifica  Mesi Uomo 
1° anno  2° anno 
1. Fenga  Livio  Istituto Nazionale di Statistica  tecnologo  4   4  
             





PARTE II

2.1 Titolo specifico del programma svolto dall'Unità di Ricerca


Testo italiano

Metodi computazionali intensivi per la costruzione di modelli previsivi di serie temporali


Testo inglese
Computational intensive methods for model building and forecasting in time series

2.2 Settori scientifico-disciplinari interessati dal Programma di Ricerca

 

SECS-S/01 - Statistica  
SECS-S/03 - Statistica economica  

2.3 Parole chiave


Testo italiano

MODELLI NON LINEARI DI SERIE TEMPORALI ; MODELLI NON STAZIONARI DI SERIE TEMPORALI ; COINTEGRAZIONE ; METODI COMPUTAZIONALI INTENSIVI


Testo inglese
NON LINEAR TIME SERIES MODELS ; NON STATIONARY TIME SERIES MODELS ; COINTEGRATION ; COMPUTATIONAL INTENSIVE METHODS

2.4 Base di partenza scientifica nazionale o internazionale


Testo italiano

Nella letteratura statistica recente si registra un crescente interesse per i metodi di analisi di serie temporali che tentano di superare i limiti degli strumenti tradizionali legati alle ipotesi di linearita' e di stazionarieta' del secondo ordine. Le direzioni di ricerca riguardano sia la costruzione di modelli sempre piu' complessi che tengano conto delle relazioni intercorrenti tra i dati, sia l'introduzione di nuove metodologie di analisi. L'iniziale formulazione dei modelli lineari autoregressivi integrati a media mobile (ARIMA), introdotta da Box e Jenkins (1970), nel corso del tempo e' stata modificata per adattarla alla realta' delle serie osservate. In particolare sono state introdotte classi di modelli non lineari molto generali, adatti per numerosi campi di indagine, quali i modelli dipendenti dallo stato (SDM);inoltre il procedimento di integrazione per indurre la stazionarieta' e' stato approfondito nella direzione della formulazione dei modelli di cointegrazione, e delle relative procedure inferenziali.
Il rapido progresso dei mezzi di calcolo ha da un lato influenzato, dall'altro incoraggiato lo sviluppo di metodi computazionali intensivi per l'inferenza statistica e la costruzione di modelli. In particolare questo progetto considerera' algoritmi evolutivi e tecniche bootstrap di ricampionamento.
Di questi aspetti, il presente programma di ricerca prende come base specifiche proposte formulate in letteratura.
Per quanto concerne i modelli SDM, la base di partenza e' costituita principalmente dal lavoro fondamentale di Priestley (1988a). I modelli SDM includono, come casi particolari, tra gli altri, i modelli esponenziali autoregressivi, a soglia e bilineari. Specifiche proposte per la identificazione, la stima,e il controllo diagnostico di queste classi di modelli sono dovute a moltissimi autori, tra i quali possiamo citare, ben lungi dall'essere esaurienti, lo stesso Priestley (1988b), Haggan e Ozaki (1981), Granger e Andersen (1978), Tong (1983), Granger e Teräsvirta (1993), Yadavalli e Singh (2000). Un importante aspetto, in grado di influenzare e di invalidare i risultati delle classiche fasi, prima delineate, di costruzione di un modello per serie temporali, e' la presenza di dati anomali nelle varie accezioni (Fox, 1972), ovvero la necessita' di ricostruire dati mancanti. Si veda, ad esempio, Chan (1994), Chen (1997) e Tolvi (2000). La complessita' incomparabilmente maggiore delle procedure di inferenza statistica puo' essere affrontata tramite il ricorso alle tecniche computazionali intensive e a nuove classi di algoritmi, detti genericamente meta-euristici, o euristici generali (Osman e Kelly, 1996), che sono stocastici in linea di principio e consentono spesso di individuare l'ottimo globale in casi in cui algoritmi, pure bene impostati e di uso corrente, conducono all’individuazione di un ottimo locale (quest’ultimo dipende, in generale, dalla particolare specificazione dei valori iniziali adoperati per “innescare” l’algoritmo). Ad esempio, Brooks e Morgan (1995) hanno proposto l’uso degli algoritmi “simulated annealing”. Gli algoritmi genetici (Holland, 1975; Goldberg, 1989; Michalewicz, 1996; Mitchell, 1996) sono anche particolarmente utilizzati per la loro versatilità e flessibilità, e per essersi rivelati efficaci nelle procedure di stima di parametri di modelli statistici (Chatterjee, Laudato e Lynch, 1996; Chatterjee e Laudato, 1997). Per l’analisi delle serie temporali, l’utilizzazione di algoritmi genetici è stata proposta sia per la specificazione e la stima del modello (Gaetan, 2000; Minerva e Poli, 2001) che per l’individuazione e la valutazione dei dati anomali (Baragona, Battaglia e Calzini, 2001).
L'estensione alle serie temporali vettoriali dei modelli ARIMA (Reinsel, 1993) e SDM e' stata studiata piu' di recente e per certi aspetti solo parzialmente. Ad esempio, si sono considerati in particolare, tra i modelli lineari, gli autoregressivi vettoriali (VAR) e, tra i modelli non lineari, i modelli autoregressivi a soglia (Tong, 1990, p. 99). Tsay, Pena e Pankratz (2000) hanno studiato metodi per individuare e valutare la presenza di dati anomali in serie temporali multivariate. La rilevanza della proprieta' di stazionarieta' congiunta ha portato alla definizione e lo studio del concetto di cointegrazione.
La cointegrazione e' un aspetto importante dei piu' recenti contributi alla modellistica per serie temporali multiple per l’analisi delle relazioni tra serie temporali non stazionarie, soprattutto di natura economica. Com’è noto, uno dei maggiori problemi in tale ambito riguarda lo stabilire se le serie in esame siano cointegrate e quale sia l’ordine di cointegrazione. Il problema della verifica dell’ipotesi di cointegrazione è stato affrontato da diversi punti di vista (Engle e Granger, 1987; Stock e Watson, 1988; Fountis e Dickey, 1989; Phillips e Ouliaris, 1990; Johansen, 1991; 1995). La distorsione delle procedure nel caso di piccoli campioni sono state affrontate in due modi: da un lato, utilizzando statistiche corrette mediante l'applicazione di fattori di Bartlett, le cui distribuzioni siano quindi più vicine a quelle asintotiche (Johansen, 2000); dall'altro, tentando di stimare l'effettiva distribuzione mediante il bootstrap (tra gli altri, Fachin, 2000, Gredenhoff e Jacobson, 2001). Omtzigt e Fachin (2001) hanno riesaminato le modalità sia del calcolo del fattore di Bartlett che di costruzione di test bootstrap nei modelli vettoriali autoregressivi (VAR) cointegrati, e verificato mediante simulazioni Monte Carlo i risultati forniti dai due metodi.


Testo inglese
In the last few years there has been a growing interest about the time series analysis methods that supersede the traditional techniques where linearity and second order stationarity are assumed. The new perspectives are concerned with models that can represent complex relationships in the data. The autoregressive integrated moving average (ARIMA) models introduced by Box and Jenkins (1970) were extended and generalised along many directions. The state dependent models (SDM), for instance, assume that the linearity hypothesis may be no longer valid; also, besides integrated time series, the cointegration analysis was intended to discover possible stationary aggregation in multivariate time series. The powerful computational devices now available both influenced and encouraged the development of procedures for statistic inference and model building. In particular, the present project addresses evolutionary algorithms, and bootstrap techniques.
The SDM were proposed by Priestley (1988a). They include as special cases a wide class of non linear and/or non stationary models, such as the exponential autoregressive, the threshold and the bilinear ones. All those models have been studied by many authors. To mention but a few, see, for instance, Priestley (1988b), Haggan and Ozaki (1981), Tong (1983), Granger and Andersen (1978), Granger and Teräsvirta (1993), Yadavalli and Singh (2000). As for linear models, the non linear ones may be influenced by outliers (Fox, 1972), or some data may be missing. See, for instance, Chan (1994), Chen (1997), Tolvi (2000). The computational intensive techniques and the meta-heuristic (or general heuristic) algorithms (Osman and Kelly, 1996) may help this difficult task be accomplished satisfactorily. For instance, the simulated annealing algorithm has been proposed for optimisation by Brooks and Morgan (1995). The class of the genetic algorithms (Holland, 1975; Goldberg, 1989; Michalewicz, 1996; Mitchell, 1996) proved to be able to cope with estimation and statistical inference (Chatterjee, Laudato and Lynch, 1996; Chatterjee and Laudato, 1997). Some genetic algorithm applications for time series model building and outliers detection were presented by Gaetan (2000), Minerva and Poli (2001), Baragona, Battaglia and Calzini (2001), amongst others.
Only more recently ARMA and SDM models have been extended to multiple time series. Vector autoregressive models have been deeply analysed, and some non linear models, for example threshold autoregressive (Tong, 1990, p. 99) have also been introduced. Tsay, Pena and Pankratz (2000) addressed the identification and estimation problem for outliers in multiple time series. The relevance of the joint stationarity property led to the development of the concept of cointegration.
Cointegration is an important feature of the recent developments in multivariate time series, mainly for the analysis of relationships among economic non stationary time series. We focus on the existence of some cointegration vector. This topic has received much attention because many sets of economic time series are likely to be cointegrated (see, for instance, Engle and Granger, 1987; Stock and Watson, 1988; Fountis and Dickey, 1989; Phillips and Ouliaris, 1990; Johansen, 1991; 1995). Yet, for small samples, testing for cointegration and order determination may still be considered an open problem. Some proposals were formulated which use Bartlett factors for correction (Johansen, 2000), or perform a bootstrap estimate (Fachin, 2000; Gredenhoff and Jacobson, 2001). Both alternatives have been investigated by Omtzigt and Fachin (2001) on vector autoregressive cointegrated models by using a Monte Carlo experiment.

2.4.a Riferimenti bibliografici

Baragona, R., Battaglia, F. and Calzini, C. (2001) "Genetic algorithms for the identification of additive and innovation outliers in time series", Comput Statist & Data Anal, 37, 1-12.
Box, G. E. P. and Jenkins, G. M. (1970) Time Series Analysis: Forecasting and Control. Holden-Day, San Francisco.
Brooks, S. P. and Morgan, B. J. T. (1995) “Optimization using simulated annealing” The Statistician, 44, 241-257.
Chan, W. S. (1994) “The robust estimation of threshold autoregression” J. of Forecasting, 13, 37-49.
Chatterjee, S. and Laudato, M. (1997) “Genetic Algorithms in Statistics: Procedures and Applications” Comm. in Statistics – Simula. Comp., 26(4), 1617—1630.
Chatterjee, S., Laudato, M. and Lynch, L.A. (1996) Genetic algorithms and their Statist. applications: an introduction. Comput. Statist & Data Anal.22, 633-651.
Chen, Cathy W. S. (1997) ``Detection of additive outliers in bilinear time series'' Comput. Statist. & Data Anal.24 , 283-294.
Engle, R. F. and Granger, C. W. J. (1987) “Co-integration and Error Correction: Representation,Estimation, and Testing”, Econometrica, 55, 251-267.
Fachin, S. (2000) ``Bootstrap and asymptotic tests of long-run relationships in cointegrated systems'' Oxford Bull. Econ. and Statist., vol. 62, pp. 577-585.
Fountis, N. G. and Dickey, D. A. (1989) “Testing for a Unit Root Nonstationarity in Multivariate Autoregressive Time Series”, Ann. Statist.,17, 419-428.
Fox, A.J. (1972) "Outliers in time series". J. of the R. Statist. Society, Series B, 43, 350-363.
Franses, P.H. and van Dijk, K.D. (2000) Nonlinear timeseries in empirical finance. Cambridge University Press, Cambridge.
Gaetan, C. (2000) "Subset ARMA model identification using genetic algorithms", J. of Time Series Analysis, 21, 559-570.
Goldberg, D. E. (1989) Genetic Algorithms in Search, Optimization and Machine Learning. Addison-Wesley.
Granger, Clive W.J. and Andersen, A. (1978) Introduction to Bilinear Time Series Models, Vandenhoeck & Ruprect, Gottingen.
Granger, CliveW.J. and Teräsvirta, T. (1993) Modelling Nonlinear Dynamic Relationships, Oxford University Press.
Gredenhoff, M. and T. Jacobson (2001) ``Bootstrap Testing Linear Restrictions on Cointegrating Vectors'' J. of Business and Economic Statistics vol. 19, pp. 63-72.
Haggan V. and Ozaki T. (1981) “Modelling nonlinear random vibrations using an amplitude-dependent autoregressive time series model” Biometrika, 68, 189-196.
Holland, J. M. (1975) Adaptation in Natural and Artificial Systems: an Introductory Analysis with Applications to Biology, Control and AI. The University of Michigan Press, Ann Arbor, MI.
Johansen, S. (1991) “Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models”, Econometrica, 59, 1551-1580.
Johansen, S. (1995) “Likelihood-based Inference in Cointegrated Vector Auto-regressive Models, Oxford University Press.
Johansen, S. (2000) ``A Bartlett Correction Factor for Tests on the Cointegrating Relations'' Econometric Theory, vol. 16, pp. 740-778.
Li, C.W. and Li, W.K. (1996) "On a double threshold autoregressive heteroskedastic time series model", Journal of Applied Econometrics, vol. 11, pp. 253- 274.
Michalewicz, Z. (1996) Genetic Algorithms + Data Structures = Evolution Programs (Third ed.), Springer-Verlag.
Minerva, T. and Poli, I. (2001) Building ARMA models by genetic algorithms. Lecture Notes in Computer Science, 2037, 335-342.
Mitchell, M. (1996) An Introduction to Genetic Algorithms, The MIT Press.
Omtzigt, P. and Fachin, S. (2001) “Bootstrapping and Bartlett corrections in the cointegrated VAR model” .Presented at: "Casuality and Exogeneity in Econometrics", European Conference Series in Quantitative Economics and Econometrics – (EC)2, Louvain-la-Neuve.
Osman, H. I. and Kelly, J. P. (Eds.) (1996) Meta-Heuristics: Theory and Applications, Kluwer Academic Publishers, Boston.
Phillips, P. C. B. and Ouliaris, S. (1990) “Asymptotic Properties of Residual Based Tests for Cointegration”, Econometrica, 58,165-193.
Priestley, M. B. (1988a) Non linear and non stationary time series, Academic Press, London.
Priestley, M. B. (1988b) ``Current developments in time series modelling'' J. of Econometrics, 37 , 67-86.
Reinsel, G. C: (1993) Elements of multivariate time series analysis. Springer Verlag, New York.
Stock, J. H. and Watson, M.W. (1988) “Testing for Common Trends”, J. of the Am. Statist. Association, 83, 1097-1107.
Terasvirta, T. (1994) "Specification, estimation and evaluation of smooth transition autoregressive models", Journal of the American Statistical Association", vol. 89, pp. 208- 218.
Tolvi, Jussi (2000) ``The effects of outliers on two nonlinearity tests'' Comm. in Statistics – Simula. Comp., 29 (3) , 897-918.
Tong, H. (1983) A threshold model in non linear time series analysis, Lecture Notes in Statistics, Springer .
Tong, H. (1990) Non linear time series. A dynamical system approach. Clarendon Press, Oxford.
Tsay, R.S., Pena, D. and Pankratz, A. E. (2000) Outliers in multivariate time series. Biometrika 87, 789-804.
Vidakovic, B. (1999) Statistical modelling by wavelets. Wiley, new York.
Yadavalli, V. S. Sarma and Singh, N. (2000) ``Markovian representation of a bilinear time series model and maximum likelihood estimation of the parameters'', Stochastic Analysis and Applications, 18 (2) , 309-321

2.5 Descrizione del programma e dei compiti dell'Unità di Ricerca


Testo italiano

L’identificazione, la stima e il confronto di modelli statistici adeguati per la rappresentazione di serie temporali “difficili” sono oggetto di notevole interesse da parte degli studiosi in molti campi, sia teorici sia applicativi. Le risorse del calcolo automatico, crescenti e sempre più diffuse, conferiscono, inoltre, continuo impulso a nuove proposte metodologiche, in quanto rendono possibile, tramite il ricorso a procedure computazionali intensive, la soluzione di problemi intrattabili analiticamente. Il calcolo, infine, è, a sua volta, supportato da nuovi e importanti risultati teorici che ne giustificano e definiscono l’impiego. La mole dell’attività di ricerca svolta in questo ambito è evidenziata dalla numerosità e dal livello qualitativo degli articoli e delle monografie. Il problema, data la sua vastità e complessità, e’, d’altra parte, ben lungi dall’essere esaurito. Il contributo che si ritiene di poter dare nell’ambito del presente programma di ricerca riguarda la costruzione e la verifica, attraverso metodi computazionali, di modelli rappresentativi e previsivi per quelle che abbiamo chiamato serie temporali “difficili”, per le quali, cioè, i modelli lineari stazionari si rivelano, in tutto o in parte, inadeguati. Il campo di indagine principale sara' rivolto alla identificazione e alla stima di modelli che possano rientrare nella classe dei modelli dipendenti dallo stato, e al problema della esistenza di cointegrazione.
Un modello non lineare / non stazionario corrisponde a far dipendere i parametri sia dal tempo che dalle osservazioni passate della serie temporale. Questa circostanza dà luogo ad una sorta di “dualità” tra le nozioni di non linearità e di non stazionarietà. L’estensione delle procedure di identificazione, stima e previsione sviluppate per i modelli lineari passa attraverso la definizione di modello localmente stazionario e localmente lineare. Nel primo caso, lo spazio dei parametri viene suddiviso, e in ciascuna regione si assume valido un modello stazionario. E’ questo il caso, ad esempio, dello spettro evolutivo dipendente dal tempo. Nel secondo caso, e’ lo spazio degli stati ad essere suddiviso in un gran numero di piccoli segmenti all’interno di ciascuno dei quali il processo viene considerato (localmente) lineare. L’attenzione sarà rivolta alla costruzione di modelli dipendenti dallo stato (Priestley, 1988), specificandone la formulazione in modo che sia possibile determinare procedure appropriate sia per l’identificazione che per la stima dei parametri. Inoltre, si intende considerare anche la presenza di osservazioni anomale (Fox, 1972), ovvero la mancanza di osservazioni in certi intervalli di tempo. Il problema è rilevante perché gli effetti dei dati anomali, ad esempio, possono essere confusi con le componenti non lineari presenti nei dati e, d’altra parte, essi possono produrre effetti ancora più forti e permanenti che nel caso lineare. Si ritiene utile, quindi, valutare, mediante simulazione, la “robustezza” dei metodi consueti di individuazione e depurazione dei dati anomali sui fenomeni che presentano una dinamica non lineare. Inoltre, si esaminerà in qualche dettaglio il problema di definire i dati anomali nell’ambito dei modelli non lineari più comuni (threshold, bilineari, eteroschedastici condizionati, ecc.), fermo restando l’inquadramento nell’ambito dei modelli dipendenti dallo stato. Al fine di rendere applicabili le metodologie che si vogliono definire e investigare, si ritiene che gli algoritmi genetici (Holland, 1975; Goldberg, 1989; Michalewicz, 1996; Mitchell, 1996) siano in grado di fornire l’indispensabile supporto operativo. Per i problemi di identificazione, stima dei parametri, individuazione e ricostruzione di dati anomali e osservazioni mancanti gli algoritmi genetici sono già stati proposti nell’ambito dei modelli lineari di serie temporali, e la loro efficacia è emersa in modo abbastanza convincente (Chatterjee, Laudato e Lynch, 1996; Gaetan, 2000; Minerva e Poli, 2001; Baragona, Battaglia e Calzini, 2001). E’ ragionevole aspettarsi che per problemi più complicati e di più difficile definizione gli algoritmi genetici costituiscano una importante risorsa per soddisfare le necessità di carattere computazionale.
In particolare, la specifica adeguatezza degli algoritmi genetici alla ricerca dell'ottimo in un insieme di soluzioni discreto di grandi dimensioni ne suggerisce l'uso nella individuazione dei regimi e delle soglie per i modelli threshold (Tong, 1983) e per tutti quei modelli piu' specializati che, a partire da questa formulazione, sono stati proposti, come quelli a transizione lenta (Terasvirta, 1994) e quelli che prevedono regimi diversi anche per la variabilita' condizionale (ad esempio Li and Li, 1996, e Franses and van Dijk, 2000), che stanno trovando una sempre maggiore applicazione in finanza.
Uno specifico campo di applicazione del calcolo evolutivo, sul quale ci si propone di collaborare con le altre unita' locali del progetto, e' quello della determinazione e stima delle trasformate wavelet, che verranno usate per la costruzione di modelli previsivi e per la decomposizione della variabilita' (si veda ad es. Vidakovic).
In questo progetto verrà esaminato in modo approfondito, per la sua rilevanza applicativa, il caso della cointegrazione. Negli anni recenti il concetto di cointegrazione è stato largamente impiegato nell’analisi delle relazioni tra serie temporali non stazionarie, soprattutto di natura economica. Ricordiamo che una serie multivariata si dice cointegrata se tutte le componenti sono integrate diciamo di ordine d, cioe’ non sono stazionarie ma lo diventano se differenziate d volte, ed esiste una loro combinazione lineare che e’ integrata di ordine inferiore. Il vettore dei coefficienti di tale combinazione e’ noto come vettore di cointegrazione. Il rango di cointegrazione e’ il numero di vettori di cointegrazione linearmente indipendenti.
Com’è noto, uno dei maggiori problemi in tale ambitoriguarda lo stabilire se le serie in esame siano cointegrate e quale sia l’ordine di cointegrazione. Il problema della verifica dell’ipotesi di cointegrazione è stato affrontato da diversi punti di vista (Engle e Granger, 1987; Stock e Watson, 1988; Fountis e Dickey, 1989; Phillips e Ouliaris, 1990; Johansen, 1991; 1995). Tuttavia nessuna delle proposte esistenti è completamente soddisfacente. Ad esempio di solito le procedure applicabili si basano su risultati asintotici che sono influenzati da aspetti del problema non di diretto interesse, quali la forma del trend, e possono fornire errori standard ottimistici. Inoltre, per piccoli campioni, la procedura asintotica di Johansen (1991) è seriamente distorta. Le possibili alternative, nell’ambito dell’impostazione classica, sono due:
(a) Utilizzare delle statistiche corrette mediante l'applicazione di fattori di Bartlett, le cui distribuzioni siano quindi più vicine a quelle asintotiche (Johansen, 2000);
(b) Cercare di stimare l'effettiva distribuzione mediante il bootstrap (tra gli altri, Fachin, 2000, Gredenhoff e Jacobson, 2001).
Omtzigt e Fachin (2001) hanno riesaminato le modalità sia del calcolo del fattore di Bartlett che di costruzione di test bootstrap nei VAR cointegrati, e verificato mediante simulazioni Monte Carlo i risultati forniti dai due metodi.I risultati possono essere riassunti in tre punti:
(1) I test asintotici sono talmente distorti che non dovrebbero mai essere usati;
(2) I test corretti mediante il fattore di Bartlett, pur avendo errori di prima specie molto maggiori della significatività nominale, sono comunque molto meno distorti delle procedure asintotiche e possono quindi essere usati, sia pure con cautela;
(3) I test bootstrap hanno la minore distorsione e potenza solo leggermente minore dei test con correzione di Bartlett.
Il terzo punto è di particolare importanza: la correzione di Bartlett è stata infatti finora calcolata solamente per i test di minore interesse empirico, ossia quelli la cui ipotesi nulla fissa interi vettori di cointegrazione. Non esiste quindi ancora nessuna indicazione su come verificare in piccoli campioni sia ipotesi su solamente una parte dello spazio di cointegrazione che ipotesi in forma di vincoli lineari. Una importante linea di ricerca è quindi data innanzitutto dall’estensionea questa classe di test delle procedure bootstrap sviluppate in Omtzigt e Fachin; sviluppi ulteriori dovranno poi affrontare il problema di test in presenza di cambiamenti strutturali nello spazio di cointegrazione.


Testo inglese
Identification, estimation and comparison of statistical models for time series of “complex” nature is one of the main current interest of applied and theoretical statisticians. The more and more developed and widespread computer devices give increasing impulse to new methodologies. In fact recent substantial advances in computational methods led to the solution of analytically intractable problems. On the other hand, the use of computational procedures has been supported by new and important theoretical results. The size of the research activity in this field could be measured by the large number and the qualitative level of the papers and monographs appeared in the recent statistical literature. However, due to its complexity, the problem has not been completely solved. The contribution we intend to give within this research program is towards the building and the validation of models useful for representing and forecasting time series which may be considered complex in some sense, i.e. such that linear stationary models seem to be inadequate. Of course computational methods will be adopted when needed. The investigation will be mainly concerned with the identification and estimation of models in the class of state dependent models and the problem of the detection of cointegration.
In a non linear or non stationary model the parameters depend both on time and on previous observations. This circumstance gives rise to a sort of “duality“ between the notions of non linearity and non stationarity. The generalisation of the procedures of identification, estimation and forecast proposed for linear models goes through the definition of locally stationary and locally linear models. In the first case, the parameter space is partitioned and in each region a stationary model is adopted. For example this is the case of the evolutionary time dependent spectrum. In the second case the space of the states is partitioned in a large number of small segments and in each of them the process is considered (locally) linear. The attention will be focused on the construction of state dependent models (Priestley, 1988), whose formulation could facilitate the proposal of procedures suitable for the identification and the parameters estimation. We intend to take into account also the presence of outliers (Fox, 1972) and missing observations. The relevance of the problem is linked to the fact that the effect of outliers may be confused with non linear components and they may produce strong and permanent effects also in the case of linear models. One of our aim will be to evaluate, through simulations, the “robustness” of the usual methods to identify and remove the effect of outliers on phenomena presenting a non linear dynamic. Then we will examine the problem of defining outliers in the most common classes of non linear models (threshold, bilinear, conditional etheroschedastic, etc.), always in the state dependent model setting. We believe genetic algorithms (Holland, 1975; Goldberg, 1989; Michalewicz, 1996; Mitchell, 1996) could supply the operational support to the application of the methodologies we intend to introduce and test. Genetic algorithms have already been successfully applied to solve the problems of identification, parameter estimation, detection of outliers and reconstruction of missing data in linear models for time series (Chatterjee, Laudato and Lynch, 1996; Gaetan, 2000; Minerva and Poli, 2001; Baragona, Battaglia and Calzini, 2001). It is reasonable to expect that in more complex situations genetic algorithms will represent an important device to solve computational problems.
In particular, genetic algorithms are successful for optimum search inside a very large discrete solution space, therefore they may be employed for selecting regimes and thresholds in threshold modeling (Tong, 1983), and also for all those more specialized models which generalise the threshold idea, such as smooth transition autoregressive (Terasvirta, 1994) and multi-regime models for conditional heteroskedasticity (for example Li and Li, 1996, and Frans and van Dijk, 2000), which are now increasingly applied in financial problems.
Furthermore, evolutionary algorithms will be employed for choosing and estimating wavelet transforms, which will be employed for building predictive models and in the variance decomposition. This part of our research will be carried out in collaboration with the Florence and Venice units.
We shall also focus on the problem of cointegration, which is particularly relevant from an applied point of view. The concept of cointegration is being widely used in empirical studies in various areas of economics in order to analyse relationships among nonstationary time series. We recall that a univariate time series is said to be integrated of order d when it is non stationary, but it becomes stationary if differentiated d times. While a multivariate time series is said to be cointegrated when all its components are integrated, e.g. of order d, and there exists a linear combination of them which is integrated of lower order. The vector of the coefficients of this linear combination is called the cointegration vector. The cointegration rank is the number of linearly independent cointegration vectors. As it is well known, one of the main problems in this setting is to state if the series are cointegrated and which is the cointegration rank. There are many different approaches concerning the problem of testing for cointegration. (Engle and Granger, 1987; Stock and Watson, 1988; Fountis and Dickey, 1989; Phillips and Ouliaris, 1990; Johansen, 1991; 1995). However none of the existing results seems to be completely satisfactory. For instance usually the proposed procedures rely mainly on asymptotic theory that may result in optimistic standard errors and with the corresponding distribution depending on side aspects, such as the form of the trend. Moreover some asymptotic procedures, e.g. the one suggested by Johansen (1991), are seriously biased if applied to small samples. From a classical point of view, there are two mainly possible alternatives:
(a) The use of Bartlett correction to obtain unbiased statistics, whose distributions are nearer to the asymptotic distributions (Johansen,2000);
(b) The application of Bootstrap to estimate the real distribution of the test statistics (see e.g. Fachin, 2000, Gredenhoff and Jacobson, 2001).
Omtzigt and Fachin (2001) analysed both the procedure to compute the Bartlett correction factor and the method to build bootstrap tests for cointegrated VAR models. The two different approaches have been compared by Monte Carlo simulations. The results obtained may be summarised as follows:
(1) Asymptotic tests should not be used, since they are usually really biased;
(2) Caution is needed when using Bartlett corrected tests. In fact their bias is much smaller than the bias of the asymptotic tests. However their actual significance levels are considerably larger than the corresponding nominal values;
(3) Bootstrap tests are less unbiased and have a power which is only slightly lower that the power of Bartlett corrected tests.
The third aspect is particularly relevant: in the literature Bartlett correction has been applied only to testswhich are not really interesting from an applied point of view, i.e. where the values of the elements of cointegration vectors are fixed in the null hypothesis. There is still no solution to the problem of testing hypotheses on a subset of the cointegration space or expressed as linear constraints. We intend first to generalise the bootstrap procedures introduced by Omtzigt and Fachin to this class of tests. Next we will concentrate on the problem of testing structural changes in the cointegration space.

2.6 Descrizione delle attrezzature già disponibili ed utilizzabili per la ricerca proposta


Testo italiano

anno di acquisizione  Descrizione 
1. 1999   Server IBM Netfinity Windows NT  


Testo inglese
anno di acquisizione  Descrizione 
1. 1999   Server IBM Netfinity Windows NT  



2.7 Descrizione della richiesta di Grandi attrezzature (GA)


Testo italiano


Nessuna

Testo inglese

Nessuna


2.8 Mesi uomo complessivi dedicati al programma

  Numero  Mesi Uomo 
Personale universitario dell'Università sede dell'Unità di Ricerca  5  65 
Personale universitario dell'Università sede dell'Unità di Ricerca (altri)  0  0 
Personale universitario di altre Università  0  0 
Personale universitario di altre Università (altri)  0  0 
Titolari di assegni di ricerca  1  6 
Titolari di borse dottorato e post-dottorato  1  6 
Personale a contratto   2  17 
Personale extrauniversitario  1  8 
TOTALE 10  102 



PARTE III


3.1 Costo complessivo del Programma dell'Unità di Ricerca


Testo italiano

Voce di spesa  Spesa in Euro  Descrizione 
Materiale inventariabile  3.500  Libri, riviste, Cd-rom, software specialistico 
Grandi Attrezzature     
Materiale di consumo e funzionamento  1.500  Cancelleria, fotocopie, partecipazione a spese generali e telefoniche 
Spese per calcolo ed elaborazione dati  500  Immissione dati, canoni, manutenzione e riparazioni 
Personale a contratto  14.000  Un laureato per ricerche bibliografiche e collaborazione agli sviluppi metodologici e applicativi della ricerca. Un tecnico elaborazione dati per le necessita' di calcolo e di realizzazione del software 
Servizi esterni  2.000  Consulenza realizzazione software 
Missioni  7.000  Viaggi dei membri e inviti a studiosi italiani e stranieri. Spese per coordinamento nazionale 
Pubblicazioni  1.000  Stampa materiale per circolazione interna e rapporti intermedi e finali 
Partecipazione / Organizzazione convegni  2.500  Quote di partecipazione. Spese per l'organizzazione dei convegni intermedi e del convegno finale 
Altro      
TOTALE 32.000    


Testo inglese
Voce di spesa  Spesa in Euro  Descrizione 
Materiale inventariabile  3.500  Books, Journals, cd-rom, specialised software 
Grandi Attrezzature     
Materiale di consumo e funzionamento  1.500  Stationery, photocopies, general and phone expenses sharing 
Spese per calcolo ed elaborazione dati  500  Data entry, fees, maintenance and fixing costs 
Personale a contratto  14.000  A graduate for bibliographical research and collaboration to research methodology and applications. A computer technician for computing and programming activities. 
Servizi esterni  2.000  Software consultants 
Missioni  7.000  Travels of research members, foreign researchers invitation, costs for national coordination activities 
Pubblicazioni  1.000  Printing expenses for internal circulation and for intermediate and final reports 
Partecipazione / Organizzazione convegni  2.500  Registration fees. Organization of intermediate and final meetings 
Altro      
TOTALE 32.000    

 

Il progetto è già stato cofinanziato da altre amministrazioni pubbliche (art. 4 bando 2003)?     NO  



 

3.3 Tabella riassuntiva

Costo complessivo del Programma dell'Unità di Ricerca  32.000 
Costo minimo per garantire la possibilità di verifica dei risultati  25.000 
Fondi disponibili (RD)  9.600 
Fondi acquisibili (RA)  0 
Cofinanziamento di altre amministrazioni pubbliche (art. 4 bando 2003)   
Cofinanziamento richiesto al MIUR  22.400 



PARTE IV


4.1 Risorse finanziarie già disponibili all'atto della domanda e utilizzabili a sostegno del Programma

 

Provenienza  Anno  Importo disponibile  Note 
Università  2001   9.600  Fondi di Facolta e Ateneo, vari anni, titolari Battaglia e Orsingher 
Dipartimento       
CNR       
Unione Europea       
Altro       
TOTALE    9.600    


4.2 Risorse finanziarie acquisibili in data successiva a quella della domanda e utilizzabili a sostegno del programma nell'ambito della durata prevista

 

Provenienza  Anno della domanda o stipula del contratto  Stato di approvazione  Quota disponibile per il programma  Note 
Università         
Dipartimento         
CNR         
Unione Europea         
Altro         
TOTALE         


4.3 Certifico la dichiarata disponibilità e l'utilizzabilità dei fondi di cui ai punti 4.1 e 4.2:

SI



(per la copia da depositare presso l'Ateneo e per l'assenso alla diffusione via Internet delle informazioni riguardanti i programmi finanziati; legge del 31.12.96 n° 675 sulla "Tutela dei dati personali")


Firma _____________________________________   Data 21/03/2003 ore 13:14