Please use this identifier to cite or link to this item: http://hdl.handle.net/2445/42968
Title: Aportacions als mètodes estadístics per a modelar dades agregades amb correlació espacial
Author: Abellana Sangrà, Rosa Mari
Director: Ascaso Terrén, Carlos
Keywords: Estadística aplicada
Variabilitat geogràfica
Models lineals
Correlació espacial
Issue Date: 28-Jul-2003
Publisher: Universitat de Barcelona
Abstract: [cat] L'objectiu d'aquesta tesi ha estat estudiar i millorar les tècniques utilitzades en el modelatge de la variabilitat geogràfica del risc de patir o morir d'una determinada malaltia al llarg d'una àrea. Donat que aquestes dades sovint presenten correlació espacial, una metodologia adequada per modelar-les són els models lineals generalitzats mixtos. L'estimació d'aquests models es pot realitzar mitjançant dos perspectives: la bayesiana i la frequentista Des d'un punt de vista bayesià el procediment d'estimació és la fully bayesian y des de la frequentista el mètode més utilitzat és la quasiversosimilitut penalitzada. El primer objectiu de la tesis ha estat comparar aquests dos procediments. Aquesta comparació s'ha realitzat en termes de biaix i precisió mitjançant un estudi de simulació. La principal conclusió que s'ha obtingut es que els dos procediments no presenten grans diferències tot i que en situacions d'un nombre petit de regions i de casos esperats les estimacions fully bayesian presenten uns resultats més consistents i en canvi amb moltes regions i casos esperats el procediment quasiversemblança penalitzada presenta més precisió en les estimacions. El segon objectiu ha estat millorar la convergència de l'algoritme de maximització utilitzat en el procediment de la quasiversosimilitud penalitzada quan es modelen dades amb correlació espacial. Aquesta millora s'ha aconseguit reparametritzant la matriu de variàncies i covariàncies dels efectes aleatoris. El tercer objectiu ha estat buscar mètodes per testar la absència d'un patró geogràfic, és a dir, la existència d'independència espacial. Per això s'han avaluat diverses proves per contrastar aquesta hipòtesis com: el test de Wald, el quocient de versemblances, el Score test, i el AKAIKE information criterion i a més s'ha estudiat el comportament del coeficient de concordança entre matrius. Els principals resultats que s'han obtingut són: el score test es la prova que presenta un millor equilibri entre l'error de tipus I i potència i el coeficient de concordança entre matrius és una mesura útil per prendre decisions sobre independència espacial, sobretot en aquells casos on el nombre de regions, casos esperats i la variància dels efectes aleatoris són petites. Finalment, s'ha il·lustrat la metodologia presentada al llarg de la tesi mitjançant una aplicació sobre el risc de diabetis tipus I a Catalunya durant els anys 1989 i 1998.
[eng] The main objective of this thesis has been to study and to improve the techniques used in the analysis of the geographical variability of the disease risk across a region. In these studies the data are spatial correlated. The useful methodology to analyze this kind of data is the generalized linear mixed models. The estimation of these models can be carried out by two point of view: bayesian and frequentist. From a bayesian point of view, the estimation is done by fully bayesian and from frequentist the approach more used is the penalized quasi likelihood. The first objective of this thesis has been to compare both approaches. The comparison has been performed in terms of bias and precision by a study of simulation. The main conclusion has been that both approaches don't present great differences but when the number of regions and expected counts are small the Fully Bayesian gives a more consistent results. However when the number of regions and expected counts are large the estimates by the penalized quasilikelihood are more precise. The second objective has been to improve the convergence of the maximization algorithm used with the approach of the penalized quasi likelihood when the data are spatial correlated. The improvement has been obtained by a reparameterization of the variance and covariance matrix of the random effects. The third objective has been to introduce the concordance coefficient between matrixes as a useful approach to evaluate the hypothesis of spatial independence. In addition, its performance has been compared to the Wald test, the score test, the likelihood ratio test and the AKAIKE information criterion. The main conclusions have been: the concordance coefficient has been shown to be a useful measure to decide spatial independence, mainly in those cases in which the region number, expected counts and the random effects variance are small and the score test is the test which presents a better balance between type I error and power. Finally, the results of this thesis has been applied to the Insulin-Dependent Diabetes type I data from Catalonia.
URI: http://hdl.handle.net/2445/42968
ISBN: 8468927252
Appears in Collections:Tesis Doctorals - Departament - Salut Pública

Files in This Item:
File Description SizeFormat 
TESI_RM_ABELLANA.pdf2.64 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.