CALIBRATGE: CORRECCIÓ DELS ERRORS DE MESURA I ESTANDARDITZACIÓ DE LA DIETA. Autor: Guillem Pera Blanco Director: Erik Cobo Data: Desembre de 2004


Save this PDF as:
 WORD  PNG  TXT  JPG

Tamaño: px
Comenzar la demostración a partir de la página:

Download "CALIBRATGE: CORRECCIÓ DELS ERRORS DE MESURA I ESTANDARDITZACIÓ DE LA DIETA. Autor: Guillem Pera Blanco Director: Erik Cobo Data: Desembre de 2004"

Transcripción

1 CLIBRTGE: CORRECCIÓ DELS ERRORS DE MESUR I ESTNDRDITZCIÓ DE L DIET. utor: Guillem Pera Blanco Director: Erik Cobo Data: Desembre de 2004

2 ÍNDEX 1.- RESUM ESTRUCTUR DEL PROJECTE GRÏMENTS INTRODUCCIÓ POBLCIÓ I MTERILS L estudi EPIC L estudi de calibratge Mètodes de mesura de la dieta en l EPIC El mètode de referència El mètode general MÈTODES ESTDÍSTICS Fonaments teòrics del calibratge El calibratge. El primer model de Rosner Model general de calibratge daptació del model de Rosner a estudis de cohort Enfocament individual i enfocament ecològic: Estudis multicèntrics Justificació per usar una sola mesura del R24H com a mètode de referència lternatives al calibratge lineal plicació del model de calibratge a l estudi EPIC Model de malaltia RESULTTS Descripció de la mostra L estudi de calibratge

3 7.3.- just del model de calibratge Modificacions al model de calibratge original plicació de les dades calibrades a un model de Cox per CG just del model de Cox Homogeneïtat Seguiment de més de 2 anys Correcció de la variància Models amb variables transformades, exclusions o reclassificacions DISCUSSIÓ ssumpcions del model Discussió sobre el model usat CONCLUSIÓ REFERÈNCIES NEXOS I 1.- ÍNDEX D BREVITURES I SÍMBOLS... III 2.- MODIFICCIONS L MODEL DE CLIBRTGE ORIGINL.... VII Transformacions de les variables.... VII Exclusió d outliers..... XIV Recodificació dels zeros del QF/HD... XVIII just per energia.... XXII. 3.- ESBORRNY PER UN RTICLE... XXV Introducció XXV Població i materials... XXVI Mètodes estadístics... XXVII Resultats XXXII Discussió... XXXVIII Conclusió. XLV 4.- PROGRMES INFORMÀTICS... XLVII 6

4 1. RESUM Objectiu: L error de mesura en la dieta pot provocar l atenuació dels efectes observats en relacionar aquella amb la incidència de càncer. quest projecte pretén descriure, justificar i aplicar mètodes de calibratge usant regressió lineal, per corregir els errors de mesura i estandarditzar les dades provinents de diversos centres, relatives al consum de carn en una cohort europea de més de mig milió de persones de 10 països i la relació amb l aparició de càncer gàstric (CG). Mètodes: El calibratge consisteix a aprofitar les dades d un qüestionari de dieta no esbiaixat (R) aplicat a una part de la cohort, per corregir els hazard ratios (HR) del consum de carn amb CG basats en les dades aportades per un mètode de mesura de menys qualitat (Q) però aplicat a tota la cohort. S obtenen valors predits (calibrats) per a tota la cohort a partir de la regressió entre R i Q. quests valors calibrats s apliquen a un model de Cox i se n obtenen estimacions corregides dels HR s. El projecte usarà les dades de l estudi EPIC. Resultats: Els coeficients de calibratge varien entre 0,27 i 0,73, segons el país i el gènere. L ajust del model lineal entre consum de carn mesurat amb R i amb Q és molt dolent a nivell individual (r 2 <0,20) degut a què s usa només un record de 24 hores com a mesura de referència, però a nivell grupal r 2 puja fins al voltant de 0,60. L aplicació de transformacions a les dades o l exclusió de grans consumidors no aporta millores en l ajust del model. El HR de CG obtingut per 100 grams de consum de carn es corregeix d 1,43 (IC95%=1,13-1,81) usant les dades originals a 1,97 (IC95%=1,21-3,22) usant les dades calibrades. Conclusió: Fins i tot si es vulneren algunes assumpcions en què es basa el mètode de calibratge (incorrelació entre els errors de Q i R, estimacions no esbiaixades del consum real a partir del qüestionari de referència), el calibratge serveix per corregir almenys una part del biaix amb què estimaríem els HR s si uséssim només les dades del qüestionari general. En definitiva, el calibratge és un recurs per disminuir els efectes de l error de mesura de la dieta en l estimació dels paràmetres d associació d aquella amb la malaltia. 7

5 8

6 2. ESTRUCTUR DEL PROJECTE El projecte s estructura en els apartats habituals d un article científic: Introducció, Població i materials, Mètodes estadístics, Resultats, Discussió i Conclusió, a més de la portada, l índex, les referències bibliogràfiques i els agraïments. També s inclou un anex on es podrà consultar un Índex d abreviatures i símbols, una extensió més detallada d una part dels resultats (Modificacions al model de calibratge original) no indispensable per al seguiment del projecte que s ha posat a l anex per no fer tan extens l apartat de Resultats, un Esborrany per a un article que és una versió resumida de tot el projecte (les referències, taules i figures s han de buscar en el cos del projecte) i el codi dels programes informàtics usats per obtenir els resultats. més, s inclou un Resum que permet una visió ràpida dels objectius, mètodes, resultats i conclusions del projecte. El projecte es basa en una part de la feina que desenvolupo a l Institut Català d Oncologia. Per tant he aprofitat part d aquesta feina, com l empresa també es beneficia dels coneixements adquirits a mesura que anava desenvolupant el projecte. La quantificació d hores en que he treballat sobre el calibratge en l àmbit laboral és gairebé impossible, ja que la primera vegada que vaig estudiar aquests mètodes fou el La redacció del projecte en si i l execució dels primers programes específics començà a mitjans de març de 2004, si bé des d un mes abans ja em vaig dedicar a examinar la bibliografia que encara no coneixia. Per diverses raons vaig aturar el projecte el mes de maig, per reemprendre'l el setembre de 2004, i l he acabat a finals de novembre. La dedicació mitjana ha estat d unes 16 hores setmanals durant 24 setmanes, amb una càrrega resultant d unes 380 hores (taula 1). De la previsió d hores que havia de dedicar al projecte només m he desviat clarament en l apartat de revisió bibliogràfica, amb més de 100 cites revisades. Cal remarcar que molts dels coneixements adquirits a mesura que anava recopilant bibliografia o fent els anàlisis no s han presentat en aquest projecte per manca d espai, però evidentment es veuran reflectits en la meva tasca laboral. 9

7 Taula 1. Càrrega d hores dedicades a cada part del projecte. Tasca Hores Revisió bibliogràfica 150 nàlisi i manipulació de dades 140 Redacció 60 Revisió 20 Preparació presentació 10 Per últim, una consideració lingüística: fins poc dies abans d acabar aquest projecte m he estat referint al procés de calibratge com a procés de calibració. quest terme és incorrecte, segons consta en el Diccionari de la Qualitat (Cisneros 2001) que recull termes tècnics, inclosos els termes estadístics, en català, alemany, anglès, castellà i francès. La paraula calibració en català i calibración en castellà és una traducció directa de la paraula anglesa calibration. Els termes correctes són calibratge i calibrado en català i castellà respectivament. 10

8 3. GRÏMENTS bans de res, vull agrair a l Erik Cobo, professor de la FME de la UPC i director d aquest projecte, els seus consells i comentaris. Donar les gràcies també als meus co-tutors del Servei d Epidemiologia i Registre del Càncer (SERC) de l Institut Català d Oncologia (ICO), el Víctor Moreno, professor titular de Medicina Preventiva de la UB, i el Carlos lberto González, coordinador de l estudi EPIC a Espanya i coordinador europeu de l EUR-GST, pel seu generós suport i ajut. la resta dels companys del SERC agrair la seva companyonia, especialment a la Mireia Díaz, que em va engrescar a fer la llicenciatura i em va fer de guia en aquesta carrera, i també al Toni Berenguer, Ramon Clèries, Àngela Twose, Gina lbero, Toni gudo i Juan Ramón González (SPCC) per la seva ajuda al llarg de la carrera i en el projecte. ls companys de classe, sobretot a la Sara Giner i la Laura Muñoz, proveïdores oficials d apunts, i a la Núria Pérez per les seves galetes (que em cruspia) entre classe i classe. l Nick Day (Cambridge), Pietro Ferrari (Lió) i Heindrek Boshuizen (msterdam), col legues estadístics de l EPIC Europa, pels seus brillants consells. l Josep Maria Pera, el meu pare, per fer la correcció del català d aquest projecte, i sobretot per animar-me sempre a continuar els estudis. I un agraïment molt especial a la Raquel, per la paciència i comprensió en aquests anys en què no ha estat fàcil combinar estudis, feina i família. tots vosaltres, MOLTES GRÀCIES!. 11

9 12

10 4. INTRODUCCIÓ L error de mesura és un dels problemes que sempre ha acompanyat la Ciència. Gairebé cap estudi se n pot lliurar i, com a màxim, es pot intentar minimitzar-lo perquè la influència sobre les conclusions derivades de l experiment sigui negligible. L error de mesura i el control d aquest també és un dels reptes principals als quals s enfronta l Estadística. La qualitat de les mesures és fonamental en qualsevol àmbit, però pren un especial interès en el camp de les Ciències de la Salut, on contínuament es prenen decisions basades en mesuraments (White 2003). En aquest projecte em centraré en l error de mesura de la dieta, portada a terme amb diversos instruments i en diferents poblacions, i en com es pot intentar corregir aquest error quan relacionem la dieta habitual d un individu amb l aparició d una malaltia rara i crònica com és el càncer. Una de les eines més utilitzades per corregir l error de mesura de la dieta quan calculem un paràmetre que relacioni dieta i malaltia és el calibratge (Stürmer 2002). mitjans dels 80, rmstrong (1985) fou el primer en usar el calibratge per a models lineals generals per corregir l error de mesura, tot i que és a Rosner (1989), que l aplicà després a models logístics, a qui molts n atribueixen la creació. En un estudi etiològic univariant en què volem saber l efecte d una certa variable sobre una determinada malaltia, si la variable és mesurada amb error, l efecte observat és menor que l efecte real (atenuació de l efecte). Encara més, si treballem amb un model multivariant i hi ha una o més variables mesurades amb error, l efecte observat pot estar tan sobre com infraestimat, fins i tot pels efectes de les variables mesurades correctament (ja que podrien estar correlacionades amb les variables mesurades amb error) (Greenland 1980, Kupper 1984). més, en grans estudis multicèntrics, en què els qüestionaris de dieta acostumen a ser diferents entre centres per capturar les dietes locals (Friedenreich 1994), la magnitud i la natura dels errors sistemàtics i aleatoris pot variar entre els centres i distorsionar 13

11 l estimació i interpretació de la relació global entre la dieta i la malaltia quan es combinen les diferents cohorts (Slimani 2002). Una de les eines més utilitzades per corregir l error de mesura de la dieta quan calculem un paràmetre que relacioni dieta i malaltia és el calibratge (Stürmer 2002). El primer objectiu del calibratge és, a nivell individual, intentar corregir el biaix d atenuació en el risc relatiu (RR) (o altres mesures d associació) degut als errors aleatoris de la mesura de la dieta (Slimani 2002). En estudis multicèntrics el segon objectiu seria, a nivell ecològic, ajustar per una sobre o infraestimació sistemàtica de la dieta a cada centre. quest projecte pretén descriure, justificar i aplicar mètodes de calibratge usant la regressió lineal, per corregir els errors de mesura i estandarditzar les dades provinents de diversos centres relatives al consum de carn en una cohort europea de més de mig milió de persones de 10 països i la relació amb l aparició de càncer gàstric (CG), avaluada mitjançant un model de riscos proporcionals de Cox. 14

12 5. POBLCIÓ I MTERILS 5.1 L ESTUDI EPIC L estudi EPIC (European Prospective Investigation into Cancer and nutrition) és un estudi prospectiu multicèntric sobre dieta i càncer que inclou 28 cohorts de 10 països d Europa Occidental (França, Itàlia, Espanya, Regne Unit, lemanya, Holanda, Grècia, Suècia, Dinamarca i Noruega) (Figura 1). Figura 1. Distribució geogràfica dels centres participants a l estudi EPIC. Les característiques més importants de l EPIC són la grandària ( persones), la distribució geogràfica i l heterogeneïtat dels patrons dietètics, factors socioculturals i hàbits de vida dels seus participants. Es disposa d informació sobre la dieta habitual, estil de vida, factors ambientals i antropometria, així com d una mostra de sang, tot recollit en el moment del reclutament, efectuat entre març de 1991 i abril de El 15

13 seguiment mitjà és de 5,0 anys (varia entre 1 dia fins a 10,8 anys). La majoria de casos de càncer i morts han estat detectats mitjançant un seguiment passiu, creuant bases de dades amb registres de tumors, hospitalaris i de mortalitat. lguns països han adoptat un seguiment actiu, contactant directament amb els participants o els seus familiars per detectar els casos. La informació sobre la dieta habitual (referida a l any anterior) es va recollir a través de qüestionaris de freqüencia alimentària (QF) o història de dieta (HD) desenvolupats i validats a cada país. més, es va administrar un record de 24 hores (R24H) a persones per ser usat com a mètode de referència del calibratge. quest mètode usava un software creat ad-hoc (EPIC-SOFT) que permetia estandarditzar al màxim el consum alimentari entre els diversos centres i incrementar la versemblança de que els errors de mesura fossin similars entre els centres (Slimani 2002). La població reclutada per l EPIC no va ser escollida perquè fos representativa de la població general. Es va primar més una alta participació i la seguretat d un bon seguiment (Riboli 2002). Molts sí que eren reclutats de la població general, però no sempre (participants en cribatge de càncer de mama (Utrecht, Florència), mestres (França), vegetarians i gent preocupada per la seva salut (Oxford) i donants de sang (Itàlia i Espanya)). França, Noruega, Utrecht i Nàpols només es van reclutar dones (Slimani 2002). L edat mitjana de la cohort al moment del reclutament era de 51,7 anys (rang 16-98) tot i que un 90% de la mostra tenia entre 32 i 66 anys. L estudi específic del CG es desenvolupa dins un subprojecte de l EPIC: l EUR-GST (Estudi sobre Factors mbientals, Helicobacter Pylori, Susceptibilitat Genètica i Risc de Càncer Gàstric a la Població Europea). 16

14 5.2 L ESTUDI DE CLIBRTGE La mostra de calibratge es va seleccionar de forma aleatòria de la mostra principal, ponderada per gènere i edat tenint en compte el número de casos esperats en 10 anys de seguiment. L objectiu era recollir uns participants per país. El mostreig també va tenir en compte la distribució per dies de la setmana i estacions de l any (Slimani 2002). Finalment disposem de individus amb R24H. L estudi de calibratge es va dur a terme entre el març de 1995 i el juny de Segons el país, es va trigar entre 10 a 31 mesos en recollir tots els R24H. França, lemanya i Dinamarca es van administrar els R24H només 40 minuts després de recollir el QF. Els països que ja havien fet la major part del reclutament al moment de fer el calibratge van trigar fins a 34 mesos en administrar el R24H desde l administració del qüestionari basal. L avantatge dels primers es que asseguren una participació més alta i que la dieta es refereix al mateix període de temps, però a costa d un major risc de correlació dels errors dels dos qüestionaris. La taxa de participació va variar entre un 54% (Grècia) i un 92% (lemanya), amb 7 països per sobre del 75%. La duració mitjana de l entrevista fou de 31,1 minuts i el número d ítems recollits varia entre 15 (Grècia) i 30 (Regne Unit). Els divendres van ser el dia més difícil per recollir el consum alimentari (algunes entrevistes referides a dissabte es feien els dilluns). nàlogament, els mesos d estiu també varen estar infrarepresentats (Slimani 2002). Per mirar la representativitat de la mostra de calibratge es van comparar les variables més rellevants respecte a la mostra principal. No es van trobar diferències (després d ajustar per edat) per talla, pes, índex de massa corporal (IMC) i hàbit tabàquic. Es van trobar lleus diferències per nivell educacional i activitat laboral (menys individus sense estudis i desocupats a la mostra de calibratge). També es va mirar si hi havia diferències respecte al consum QF/HD dels 16 grans grups alimentaris estudiats en cada un dels 28 centres. En un 89% de les combinacions centre-grup alimentari no es van trobar diferències majors del 10% (Slimani 2002). 17

15 5.3 MÈTODES DE MESUR DE L DIET EN L EPIC EL MÈTODE DE REFERÈNCI El mètode que s usa com a qüestionari dietètic de referència és el R24H, un dels més usats com a qüestionari de referència. En l EPIC s efectua una sola administració del R24H. Com el nom indica, l enquestat ha de reportar tot allò que ha menjat durant un dia (habitualment el dia anterior a l entrevista). D aquesta forma el biaix de memòria es redueix, en ser el consum molt recent. Un sol qüestionari de R24H no és representatiu de la dieta habitual a nivell individual, per ser referit a un sol dia, però sí a nivell grupal. El R24H es considera ideal per a comparacions interculturals del nivell de consum mitjà, i és essencialment un mètode obert que permet una descripció força detallada d un gran nombre de plats i receptes heterogenis (Witschi 1990). Comparat amb els diaris dietètics, els avantatges del R24H són taxes de participació més altes i que l entrevistador pot supervisar la recollida d informació i resoldre dubtes (Kaaks 1997). Un dels problemes d aquest mètode, com d uns altres en què intervé la memòria del subjecte, és l oblit d aliments consumits o reportar aliments no consumits (Karvetti 1985). més, factors com l edat, el nivell educatiu o l IMC poden influir en les respostes (Karvetti 1985, Klesges 1995). La percepció de dietes saludables fa que alguns individus infrareportin la mala dieta i supraestimin la bona dieta (Madden 1976). En usar el R24H (o altres mesures relacionades amb la ingesta recent (com un biomarcador)) introduim una variació addicional (incorporada a l error) respecte a les mesures del QF/HD que són a llarg termini (Schatzkin 2003). En l EPIC el R24H s administrà mitjançant un programa informàtic ad-hoc anomenat EPIC-SOFT (Slimani 1999). El qüestionari es respon en dues etapes. la primera s interroga el subjecte sobre què ha menjat el dia anterior en cada àpat (el dia s estructura en 11 possibles ocasions d ingesta), sense massa detall (p.ex.: vedella ). Un cop es té la llista d allò que ha menjat en tot el dia es repassa ítem per ítem, detallant 18

16 quins aliments, quantitats i formes de preparació. Es pregunta pels aliments més comuns si no han estat descrits pel subjecte (per exemple pa ). El programa incorpora un control de qualitat en què es comproven valors mancants o extrems. El programa porta incorporat una llista d aliments per cada país. Si l individu reporta un nou aliment aquest es grava, però a posteriori es decideix si s equipara a un aliment predefinit o s incorpora una nova entrada a la base de dades. Quan l individu no és capaç de descriure prou bé l aliment (p. ex. peix ) es registra un genèric (això impedeix que l entrevistador prengui decisions arbitràries). Els individus poden reportar receptes, aliments aïllats o acompanyants (p. ex: sucre ). Es van predefinir més de 350 receptes com a receptes estàndard en cas que l individu no sabés descriure-les (p. ex. paella de marisc ). Per ajudar a descriure la quantitat i el grau de cocció s usen fotografies. Tot el procés és estandarditzat per a tots els països. De mitjana es triguen uns 30 minuts per contestar el R24H i, en general, no es van apreciar diferències en l energia calculada a partir dels R24H per entrevistador (Slimani 2000) EL MÈTODE GENERL La majoria dels centres de l EPIC van utilitzar diferents qüestionaris per mesurar la dieta habitual a l inici de l estudi. Bàsicament, però, els podem agrupar en QF i HD. mbdós mètodes avaluen el consum habitual d una persona durant un període llarg de temps (en aquest cas un any). El QF és relativament barat i fàcil d administrar (en molts estudis s ha enviat per correu) i és un dels mètodes de mesura de la dieta més comunament usats (Kipnis 2002). Bàsicament consisteix en una graella, més o menys complexa. les files hi ha una llista d aliments o receptes estàndard. les columnes, un indicador de freqüència (per exemple quants cops a l any, al mes, a la setmana o al dia pren un determinat aliment). L individu ha d anar omplint la graella amb els aliments que consumeix indicant-ne la freqüència. lguns qüestionaris incorporen fotografies, diverses mesures o fins i tot files en blanc per afegir-hi aliments no previstos. En una comparació amb el R24H i mètodes bioquímics, els QF tenien un infrareport del 30-40% i els R24H un 10-20% per energia (Schatzkin 2003). 19

17 El mètode HD s acostuma a contestar amb l ajuda d un entrevistador i un programa informàtic. Es repassen totes les ocasions d ingesta al llarg del dia (esmorzar, dinar, sopar,...) i es pregunta pel consum habitual al llarg de l any (en una setmana tipus) en cada una d aquestes ocasions d ingesta. Es tenen en compte factors estacionals (per exemple es pregunta quants mesos a l any menja aquest aliment? ), tipus de cocció, classe de greixos afegits en cuinar o a les amanides per exemple, i s utilitzen fotografies per ajudar en les respostes. Hi ha un joc de receptes predefinides, modificables per l entrevistat. quest, a més, pot afegir nous aliments i receptes. 20

18 6. MÈTODES ESTDÍSTICS 6.1 FONMENTS TEÒRICS DEL CLIBRTGE Bàsicament el calibratge consisteix a aprofitar les dades d un qüestionari no esbiaixat aplicat a una part de la mostra, per corregir els riscos relatius (o altres mesures d associació) basats en les dades aportades per un (o diversos) qüestionaris de menys qualitat, afectes d error, però aplicats a tota la mostra. El qüestionari general és més fàcil d administrar i barat que el qüestionari de referència. En el diagrama de la figura 2 podem veure esquemàticament què fa el calibratge. Si l aparició d una certa malaltia (D) es causada pel consum d un determinat aliment (T) podem estimar l efecte d aquest consum sobre la malaltia (β * ). Se suposa que aquest efecte és estimat assumint que T ve mesurat sense error, però habitualment la dieta es mesura amb error. Podem fer servir una mesura dietètica de referència (R) que, si bé té error (e R ), almenys és una estimació no esbiaixada de T. Com que aquestes mesures acostumen a ser cares no es poden aplicar a mostres grans. Si necessitem mostres grans (per exemple per detectar efectes lleus) aleshores haurem d usar un qüestionari de menor qualitat (Q), és a dir, amb més error (e Q ). R i Q estan relacionades per un coeficient λ (coeficient de calibratge). Podem corregir (calibrar) els valors de Q a partir d R, i obtindrem uns valors predits (calibrats) X que, en relacionar-los amb la malaltia, mostren l efecte β * que hauríem obtingut usant T. D aquesta forma corregim l efecte atenuat β que obtindríem si uséssim directament Q al estimar el risc de malaltia. El model permet la inclusió de variables d ajust (U). Dins dels fonaments teòrics del calibratge veurem el model en que s usa directament la variable real per calibrar (apartat 6.1.1), el model que usa la variable de referència R (apartat 6.1.2), l aplicació específica a un disseny de cohort (apartat 6.1.3) i els avantatges del calibratge en estudis multicèntrics (apartat 6.1.4). 21

19 Figura 2. Esquema d un procés de calibratge. D=malaltia, T=consum real, R=consum de referència (mesura cara i no esbiaixada respecte a T), Q=consum mesurat amb error, U=variables d ajust, X=variable calibrada, β*=efecte real del consum sobre la malaltia, β=efecte del consum sobre la malaltia atenuat per l error de mesura, λ=pendent de la regressió entre R i Q, e R =error del mètode de referència, e Q =error del mètode general. T β * D β * X β U e R e Q R λ Q EL CLIBRTGE. EL PRIMER MODEL DE ROSNER. Inicialment Rosner (1990) proposà un model que corregia els errors, tan sistemàtics com aleatoris, que incorporés la variabilitat aportada per la correcció d aquests errors (suposa un engrandiment dels intervals de confiança; de fet, a més error més engrandiment) aplicat a un model de regressió logística. El model és pensat per a estudis de cohort sobre malalties rares, en que podem comparar els casos amb una gran quantitat de controls, i en què la variable mesurada amb error és contínua. Suposem que volem estudiar la relació d una certa malaltia (D, variable dicotòmica) amb una sèrie de variables. Lamentablement algunes (T, vector de mida k 1 x1 ) són difícils d obtenir i, per tant, hem d usar variables indirectes (surrogates) més fàcils d aconseguir però mesurades amb error (Q, vector de mida k 1 x1). Suposem que la resta de variables (U, vector de mida k 2 x1) són mesurades sense error. Per il lustrar aquest model, podem pensar en D com el fet de ser diagnosticat o no de càncer durant el seguiment de la cohort, en T com la ingesta real habitual d un cert aliment o nutrient 22

20 (mesurada en grams/dia), Q la ingesta reportada d aquest aliment per cada individu, mitjançant un qüestionari aplicat a l inici de l estudi, i U variables ben conegudes o amb un error de mesura inapreciable com gènere, edat o talla. Més endavant veurem que de vegades és impossible obtenir la mesura real T d una variable. leshores ens haurem de conformar amb usar la millor variable disponible (variable de referència R) que doni una mesura no esbiaixada de T. El model que volem estimar serà de la forma logit[pr( DTU, )] = α + β T+ β U (1). * * * 1 2 Però com que no disposem de T per a tota la cohort hem de fer logit[pr( D QU, )] = α + β Q+ β U (2) 1 2 Immediatament podem obtenir els estimadors esbiaixats (degut a l error de mesura en Q) α, β 1 i β 2 (amb β 1 i β 2 vectors de mida 1xk 1 i 1xk 2 respectivament) a partir de (2) que mostren la relació entre la malaltia i les variables estudiades. Però preferiríem disposar d uns coeficients corregits α, * β1 i * β 2, que tinguessin en compte que Q ens ve mesurada amb error i que ens diguessin quina és la relació real de D amb T i U després de controlar per U i T respectivament. Suposem que podem obtenir la ingesta real T mitjançant un mètode car o de difícil aplicació. Usant una mostra relativament petita (submostra de calibratge), en què es mesura la variable difícil d obtenir amb els dos mètodes, el que té error (Q) i el que no en té (T), a més de les variables d ajust U utilitzades en el model (2), si fem una regressió lineal múltiple usant T com a variable dependent: T = α' + λ Q+ λ U + e (3)

21 amb α, λ 1 i λ 2 matrius de mida k 1 x1, k 1 xk 1 i k 1 xk 2, i e vector de mida k 1 x1 distribuït segons una Ν(0, Σ) (0 vector mitjana de k 1 x1 zeros i Σ matriu de covariàncies k 1 xk 1 ), podem obtenir els estimadors corregits ˆ* ˆˆ 1 β = βλ (4) assumint que la distribució condicional de l exposició real T donats Q i U és la mateixa a la població d estudi que a la subpoblació de calibratge i que la distribució de l exposició al surrogate Q donada l exposició real és la mateixa pels individus malalts com sans [Pr(Q T,D=1)=Pr(Q T,D=0)] (o sigui, error no diferencial). λ s anomena factor de calibratge. L equació (4) és fàcil d obtenir si substituïm a (1) T per la part dreta de l expressió (3): Pr( D QU, ) exp[ c+ βλq+ ( β + βλ) U] (5) * * * ixí, ˆβ 1, obtingut de la regressió (2) de D amb Q i U serà un estimador consistent de * βλ 1 1 i 2 ˆβ serà un estimador consistent de β + βλ, amb * * ˆ β = ( ˆ β, ˆ β ), * * * 1 2 ˆ ˆ ˆ ( ˆ ˆ 1 2 β = β1, β2), i ˆ λ λ λ = 0 I amb 0 matriu de mida k 2 xk 1 de zeros i I matriu identitat de mida k 2 xk 2 i c = α + βα. * * 1 ' Per tant, el nou coeficient corregit * ˆβ té en compte la relació entre l exposició real T i la mesura aproximada d aquesta exposició Q al estimar la relació entre la malaltia D i la dieta T, a través d una variable mesurada amb error Q. Un cop hem obtingut el coeficient corregit ˆβ * cal donar-li uns intervals de confiança. Per això cal calcular prèviament la matriu de variàncies-covariàncies de * ˆβ. plicant el mètode delta (Rao 1973) en (4) tenim que Cov( β, β ) ( ' Σ ) + ˆ βσ ˆ β' (6) * * j1 j2 β j1, j2, j1, j2 24

22 amb ˆ 1 = λ i, j1, j2 Σ la matriu de covariàncies referida als elements de les columnes j 1 i j 2 d. Podem obtenir Σ ja que a partir del mètode delta tenim que 1 2, j, j k k k k Cov(, ) ( / ˆ λ )( / ˆ λ ) Cov( ˆ λ, ˆ λ ) ΣΣΣΣ (7) i1j1 i 2 j 2 i1j1 rs i 2 j 2 tu rs tu r= 1s= 1t= 1u= 1 amb ij element i rs r j s de la matriu. Com que per qualsevol paràmetre y, les matrius de mida kxk relacionades per (Searle 1982) / y, ˆ λ / y estan / y= ( ˆ λ / y ) (8) podem reexpressar (7) com k k k k Cov(, ) ( ) Cov( ˆ λ, ˆ λ ) ΣΣΣΣ (9) i1j1 i 2j 2 i1r sj1 i 2t uj 2 rs tu r= 1s= 1t= 1u= 1 Substituint (9) en (6) obtenim que Σ = ˆ ˆ = Σ + ˆ Σ ˆ j 1,j 2 =1,..., k (10) * * * ( j 1, j 2 ) Cov ( β j, β ) ( ' ) 1 j2 β j1, j β 2, j1, jβ β 2 * amb k=k 1 +k 2, ˆ β (i=1,2) el j i coeficient de regressió real, Σ β és la matriu kxk de j i variàncies-covariàncies de la ˆβ obtinguda en (2), ˆ 1 = λ i Σ, j1, j2 és la matriu de variàncies-covariàncies kxk dels elements de les columnes j 1 i j 2 d (equació (9)), obtinguda a partir del subestudi de calibratge usant (3). Cal notar que per obtenir (10) s assumeix que ˆβ i ˆλ són variables aleatòries independents (és a dir, la relació entre la ingesta i la malaltia és independent de l error de mesura del qüestionari). 25

23 Per últim, per obtenir l interval de confiança podem fer ˆ β ± z Var( ˆ β ) (11) * * j 1 α /2 j amb ( ˆ* j ) Var β obtinguda de Σ * ( j, j) a (10) i z 1-α/2 el percentil superior α/2 d una β distribució N(0,1). nàlogament, es pot obtenir un interval de confiança per a l odds ratio (OR) exponenciant l expressió (11). Quina quantitat d error de mesura és necessària perquè la correcció sigui útil? la taula 2 (Rosner 1990) es pot veure com si ˆλ <0,8 les diferències dels OR calculats amb la variable real i els OR calculats amb la variable surrogate (sense corregir) són prou diferents. Taula 2. Odds ratios observats * basats en un surrogate de l exposició per diferents nivells del veritable odds ratio i ˆλ. ˆλ Odds ratio real 1,5 2,0 3,0 5,0 0,2 1,08 1,15 1,25 1,38 0,3 1,13 1,23 1,39 1,62 0,4 1,18 1,32 1,55 1,90 0,5 1,22 1,41 1,73 2,24 0,6 1,28 1,52 1,93 2,63 0,7 1,33 1,62 2,16 3,09 0,8 1,38 1,74 2,41 3,62 0,9 1,44 1,87 2,69 4,26 1,0 1,50 2,00 3,00 5,00 * OR surrogate ˆ λ real = ( OR ) Coeficient de regressió entre l exposició real i el surrogate de l exposició (si la desviació estàndard de totes dues mesures fou la mateixa coincidiria amb el coeficient de correlació). 26

24 6.1.2 MODEL GENERL DE CLIBRTGE Kaaks (7D) dóna una formulació generalista del procés de calibratge. Suposem que la relació (real) entre una certa malaltia (D) i el consum habitual d un cert aliment (T) sigui lineal: E[D T] = * α + * β T (12) Estimarem * β (el paràmetre que ens diu com afecta la dieta a la probabilitat de desenvolupar la malaltia) usant mètodes de regressió. Obtenim valors aproximats de T a partir d un qüestionari dietètic Q. La presència d errors de mesura en Q ens portarà a estimar una β esbiaixada, i de fet també una pèrdua de potència estadística, ja que s atenua l efecte. Si definim X=E[T Q] com el consum real mig donat el consum observat Q i assumim que E[D Q,T]=E[D T] (o sigui, que l error de mesura és no diferencial), a partir del teorema de Bayes, Kaaks demostra que: E[D Q] = E[E[D T] Q] = α + βx (13) questa equació és idèntica a l equació (12), excepte que ara usem una estimació del consum X en comptes del consum real T. X és el consum de carn predit (calibrat) a partir del qüestionari Q. La relació entre les mesures del qüestionari Q i el consum predit X, i la relació entre Q i la malaltia D depèn de com assumim la distribució dels valors reals de consum T i dels errors del qüestionari de mesura. Molts cops s assumeix normalitat en T, amb mitjana µ T i variància σ 2 T i relació entre Q i T lineal: Q=φ Q +δ Q T+ε Q (14) questa equació és una formulació més detallada de Q=T+e Q on dividim l error total (e Q ) en sistemàtic (φ Q, δ Q ) i aleatori (ε Q )), amb l error aleatori ε Q distribuït normalment amb mitjana zero i variància σ 2 εq independent de T. Cal dir que la correlació entre un qüestionari de dieta i el consum habitual real acostuma a ser baixa (<0,7) (Willett 1985), 27

25 que implica que almenys la meitat de la variabilitat en la mesura de la ingesta és deguda a errors aleatoris (Kaaks 1995a). Els coeficients φ Q i δ Q representen el biaix constant (quan un individu tendeix a infra o supraestimar el seu consum de forma constant) i d escalat proporcional (quan aquesta infra o supraestimació és proporcional al consum real) respectivament. Kaaks (1997) diu que ε Q està correlacionat positivament amb T (o sigui, que els individus amb consum alt tindran errors positius més sovint i els de consum baix més errors negatius) cosa que provocarà sempre una infraestimació de β (aquesta infraestimació s anomena biaix d atenuació (rmstrong 1992)) i ve modulada per la correlació entre Q i T, ρ QT. En canvi, δ Q pot estar correlacionat positiva o negativament amb T. Si la covariància entre aquest error sistemàtic i T és positiva δ Q serà major que 1 (sobreestimació de Q en els que consumeixen més). En aquest cas, la direcció del biaix que afecta β és la mateixa que la que provoca ε Q (o sigui infraestimar β ). En canvi, si la covariància fos negativa (sobreestimació de Q en els que consumeixen menys) δ Q serà menor que 1, i causarà un biaix de sentit contrari al que provoca l error aleatori, arribant, fins i tot a obtenir valors de λ=1 (es cancel laria el biaix) amb presència de biaixos de diferents direccions deguts als errors aleatoris i sistemàtics (en aquest cas es pot demostrar que la covariància entre Q i l error total de mesura e Q és zero (errors berksonians (Berkson 1950) i que δ Q = ρ 2 QT )). la pràctica, però, els valors de δ Q s espera que siguin al voltant de 1 i ρ al voltant de 0,5, que provocarà que el biaix faci infraestimar β. Si multipliquem Q per un factor apropiat f, el paràmetre δ Q canviarà a fδ Q mentre que 2 QT 2 ρ QT no es veu afectat, de forma que podem aconseguir errors totals e Q berksonians (o sigui, errors que no aporten biaix). Kaaks (1997) demostra que f ha de valer precisament λ (factor de calibratge) per fer desaparèixer el biaix. Cal notar, però, que la presència d errors berksonians, si bé no dona biaix, sí que redueix la potència (més com més gran sigui ε Q ). Com que el biaix fa infraestimar β, al factor de calibratge λ també se l'anomena factor de desatenuació. Si T, Q i ε Q tenen una distribució normal es pot veure que (Kaaks 1995a) X = E[T Q] = α' + λq (15) 28

26 amb α' = (µ T - λµ Q ) i λ = ρ 2 QT /δ Q. questa expressió és exactament igual que dir que σ T λ =cov(t,q)/var(q) (Kipnis 1999) [ = ρqt (Kipnis 2002)] que és la forma més σ habitual d expressar la pendent d una regressió lineal. Quan l error dels qüestionaris Q, e Q, està correlacionat amb T, λ pot ser negativa o major que 1, però en estudis nutricionals acostuma a estar entre 0 i 1 (Kaaks 1994b), ja que habitualment ρ QT 0 i σ 2 2 T Q Q σ (Kipnis 2002). La distribució dels valors predits X serà aleshores normal, amb mitjana µ T i variància ρ 2 QT σ 2 T (Kaaks 1995a). Substituint X per α' + λq a (13) obtenim una relació lineal entre Q i D, amb una pendent β esbiaixada per un factor λ [β=λ β * ]. El factor λ és la inversa del biaix d'escala proporcional δ Q multiplicat per un factor d'atenuació 2 ρ QT que és el quadrat de la correlació entre el consum real i el mesurat. Notis també que la variància dels valors predits X és independent de δ Q i que disminueix quan decreix la correlació entre Q i T. Com es veu només cal la pendent (λ) per corregir el RR, però també cal el terme independent (α') per comparar les ingestes corregides entre les diverses submostres (Stram 2000). En estudis dietètics, habitualment no es pot mesurar directament T. Per estimar X fa falta un estudi addicional amb una mesura de referència R sense biaix (és a dir, que si repetíssim R molts cops, la seva mitjana representaria la ingesta habitual real de l individu (Carroll 1996)) R = T + ε R (16) amb ε R amb mitjana zero i independent dels errors de mesura del qüestionari general [Cov(ε R, ε Q )=0]. Si aquests errors són independents, no s espera que ε R causi biaix en l estimació de λ (aquest vindria donat només per ε Q ), per tant les mesures de referència R no han de ser necessàriament precises i es poden basar en una única administració de la mesura de referència (Kaaks 1997). Notis que l error total de R (e R ) coincideix amb l error aleatori ε R ja que R no té error sistemàtic. Sota aquestes assumpcions 29

27 E[R Q]=E[T Q] i els valors predits X es poden estimar a partir de la regressió de R sobre Q i la variància de X es pot obtenir calculant directament la variància dels valors predits per aquesta regressió (Carroll 1996). Kipnis (1999) afegeix que cov(r,q)=cov(t,q) sota les assumpcions del model de calibratge (és molt fàcil de veure si Q=T+e Q i R=T+e R amb cov(e R,T)=0 i cov(e R,e Q )=0). ssumint la normalitat conjunta de T, Q i ε Q (com a (14)) ara podem estimar els valors predits X com (Kaaks 1995a) X=E[R Q]= α' + λq (17) (noteu l analogia amb (15)); això vol dir essencialment un reescalament lineal dels qüestionaris basals Q (d aquí ve el nom de calibratge). Una forma ràpida de veure per què les dades calibrades X tenen menor variància és que com que λ és habitualment inferior a 1, i var(x)=λ var(q) aleshores var(x)<var(q) (Willett 1998). Spiegelman (2001) dóna un model general: g[e(d T)]= α * + β * T amb g(.) una funció de link que linearitza la funció mitjana condicional. De fet, però, en el model no hi posem T sinó X (obtingut de regressar R en Q). Quan g(.)=e(d X) tenim el model lineal, quan g(.)=logit[e(d X)] tenim el model logístic. Quan g[e(d X)]=logI(t X=0) + βx, amb I(t) taxa d incidència en el temps t i g[e(d X)]=log[I(t X)], aleshores tenim un model de regressió de riscos proporcionals de Cox. Els mateixos mètodes de correcció de Rosner (1990) per a la regressió logística són aplicables per a regressió lineal (Spiegelman 1997b) DPTCIÓ DEL MODEL DE ROSNER ESTUDIS DE COHORT Plummer (1994) adapta el mètode de Rosner per treballar amb taxes d incidència en comptes d OR: si la taxa d incidència de la malaltia (a) es relaciona amb el consum habitual T mitjançant un model log-lineal log(a)= α * + β * T (18) 30

28 * ( β és el logaritme del RR per una unitat de diferència en el consum real) assumint que la ingesta habitual de cada individu és constant, però que varia entre individus, i que dins de cada cohort els consums estan distribuïts normalment, a nivell cohort observem que (Prentice 1982) log(a i )= * α + * * β µ i +( β τ i ) 2 /2 (19) amb µ i i τ i mitjana i desviació estàndard del consum a la cohort i. Si assumim que el darrer terme de (19) es pot ignorar, aleshores la relació entre la ingesta i la malaltia també és lineal a nivell cohort. questa assumpció tindria sentit si * ( β τ i ) 2 /2 fos petit o variés poc entre les cohorts (es faria gairebé constant i seria * absorbit per α ). Sota aquestes circumstàncies, la informació sobre la relació malaltiadieta a nivell ecològic és un reflex de la relació malaltia-dieta a nivell individual. L efecte ˆβ estimat en relacionar la taxa de malaltia amb l exposició mesurada amb el mètode general Q (assumim que aquest valor sigui relativament constant al llarg del seguiment) ve esbiaixat per un factor λ, així que la relació real entre malaltia i 1 l exposició serà ˆˆ βλ, havent obtingut ˆλ de fer la regressió de T (o un mètode de referència vàlid R) respecte a Q. Un procediment alternatiu a haver de calcular ˆβ, ˆλ i haver de dividir-les és calcular directament l efecte corregit * ˆβ usant en el model (18) la ingesta calibrada X en comptes de T (Plummer 1994). questa ingesta calibrada només és el resultat d aplicar els valors predits per a tota la cohort usant la ingesta general Q, i aplicant els coeficients obtinguts de la regressió entre R i Q (vegeu que si es vol es pot incorporar l efecte de variables de confusió). Spiegelman (1997b) demostra que un model de riscos proporcionals de Cox es calibra exactament igual com fa Rosner (1990) amb la regressió logística. Cal que els residus de la regressió de T amb Q siguin normals, que l error sigui no diferencial, que les pèrdues del seguiment siguin independents de l exposició, que es tracti d una malaltia rara, amb un RR moderat i un error de mesura baix. En canvi, Carroll (1990) diu que no cal assumir normalitat en els residus del calibratge. 31

29 Un exemple de com pot variar el RR (Schatzkin 2003): per λ=0,4, un RR real de 2 s observaria com 2 0,4 =1, ENFOCMENT INDIVIDUL I ENFOCMENT ECOLÒGIC: ESTUDIS MULTICÈNTRICS. El principal objectiu de la l estandardització d una eina de mesura dietètica és minimitzar (les diferències en) l error de mesura (Slimani 2000). En aquest apartat veurem com la precisió del risc relatiu es pot millorar tenint en compte també la variabilitat entre cohorts a més de la variabilitat intracohorts en un estudi multicèntric. La limitada variabilitat interindividu dels patrons dietètics que s observa en estudis d àmbit nacional ha justificat la necessitat de fer grans estudis multicèntrics (Kaaks 1997). quest enfoc incrementa la variabilitat de la ingesta i la mida mostral de la cohort i fa possible contestar preguntes que no són resolubles en estudis monocèntrics o multicèntrics d abast solament nacional. En canvi, els desavantatges d estudiar una gran cohort multicèntrica són que cal usar un instrument econòmic per mesurar la dieta i problemes de comparabilitat de les dades entre centres (Kynast-Wolf 2002). Molts cops l eina de mesura de la dieta s adapta a les característiques de la població i els aliments de cada país. ixí, malgrat l existència d un protocol comú per a l estudi, hi haurà diferències per país en l obtenció de les dades, que donen lloc a diferents estructures en l error de mesura. ixò pot impedir un ús directe de les mesures dietètiques en l obtenció dels riscos del consum en relació amb una malaltia (Riboli 2000). Per superar aquests obstacles, el calibratge, basat en un qüestionari de mesura de més qualitat i aplicat uniformement a una submostra de tots els centres, permet una correcció dels riscos obtinguts mitjançant les variables originals (Kynast-Wolf 2002). Quan treballem amb estudis multicèntrics, podem abordar la relació de l exposició i la malaltia des d una perspectiva ecològica o nivell cohort (relació entre el valor mig d exposició a cada subcohort i la malaltia) o des d un enfoc individual (relació entre l exposició i la malaltia dintre de cada subcohort) (Plummer 1994). Si tots els individus d una mateixa subcohort tinguessin la mateixa ingesta no caldria treballar a nivell individual. nàlogament, si la mitjana de consum a cada subcohort fos la mateixa no 32

30 caldria treballar a nivell ecològic. Tots dos enfocs tenen mancances: el nivell ecològic no permet ajustar per variables de confusió (Greenland 1992) i s ha demostrat la inconveniència de barrejar diferents cohorts sense tenir en compte, en fer l anàlisi a nivell individual, que els individus procedeixen de diferents cohorts (Piantadosi 1998). Per exemple, és habitual trobar discrepàncies entre tots dos nivells. Podem trobar un factor associat a una malaltia a nivell individual, però degut a la falta de control sobre les variables de confusió no trobar-lo a nivell ecològic; o trobar la relació a nivell ecològic però no trobar-la a nivell individual pel fet que l efecte ha estat atenuat per l error de mesura. En un estudi multicèntric es poden obviar aquests problemes ajustant per les variables de confusió abans d agregar les dades. més, cal tenir en compte que el nivell d error sistemàtic pot afectar de forma diferent a les diverses cohorts, més si tenim en compte que es poden haver usat diferents eines de mesura per mesurar la mateixa variable; i que l error aleatori individual de mesura pot afectar també de forma diferent a cada cohort. El calibratge pot corregir aquests problemes. Diferències en el biaix proporcional δ Qi o en la correlació entre Q i i T i, ρ QTi, entre les diverses cohorts donarà lloc a diferents graus de biaix en l estimador del RR β i per a cada cohort i (Kaaks 1995b). Com que utilitzem models de la família exponencial, el factor de biaix constant φ Q no afecta a l estimació de β (Kaaks 1995b). L heterogeneïtat de l estimador de β i per cada cohort deguda a les diferències del biaix provocades pel diferent grau d error en els qüestionaris Q i així com la millora de la precisió de l estimador global β pot ser corregida per l ús de la mesura de referència R (via calibratge) (Kaaks 1994a). El calibratge millorarà la comparabilitat dels diferents riscos relatius entre cohorts només si cada factor de calibratge λ i s estima amb prou precisió (Kaaks 1995b). Kaaks (1995b) demostra que el calibratge és més eficient incrementant el nombre d individus en l estudi de calibratge o incrementant la correlació entre R i Q. Resumint, el calibratge permet corregir simultàniament les diferències entre cohorts quant a biaix d atenuació (pels errors aleatoris en els qüestionaris basals) i els biaixos proporcionals d escala δ Q deguts a les correlacions intracohort entre els errors de mesura i els valors reals d ingesta. La quantificació d aquests guanys en precisió degut a 33

31 reduir l heterogeneïtat intercohort dependrà del grau d heterogeneïtat observat i si es pot assumir o no que els riscos relatius (reals) siguin idèntics entre les cohorts (Kaaks 1995b) (indicaria un model d efectes fixos o aleatoris respectivament (Spector 1991)). Kaaks (1994a) dóna una bona explicació de com estimar el RR a nivell ecològic i individual i com combinar-los. Un dels handicaps amb que s han trobat els estudis sobre dieta i càncer és una exposició massa homogènia, que porta a una disminució de la potència estadística (Wynder 1987). Tenint en compte que la majoria de RR s entre els quintils superior i inferior d ingesta no deuen ser majors de 4 per a la majoria d aliments i nutrients i tipus de càncer, la presència d errors de mesura encara faria més difícil detectar aquestes associacions. més de l increment de la mostra o de la precisió de la mesura podem, doncs, incrementar l heterogeneïtat de l exposició per augmentar-ne la potència. Kaaks (1994a) considera un estudi multicèntric, compost per j cohorts. ssumint que dins de cada cohort hi ha una relació lineal entre el logaritme de la taxa d incidència de la malaltia D i una exposició real subjacent T D = D + β * ( T T) (20) i i i i (per simplicitat ignorem les possibles variables de confusió), les pendents d aquestes relacions log-lineals, * β i, són exactament les mateixes que el logaritme del RR d emmalaltir per una unitat de diferència en l exposició a dins de cada cohort. Podem estimar β (treiem l asterisc per indicar que es basa en un qüestionari Q i no en la ingesta real T), amb la variància de βi donada per (Truett 1967): ˆ 1 Var( β i ) = (21) c Var ˆ ( Q) í i on c i és el nombre de casos a la cohort i i Vâr i (Q) és la variància del qüestionari de dieta de la cohort i. Podem combinar les diferents ˆi β obtingudes a cada cohort en una ˆW β que resumeixi les relacions observades entre l exposició i el logaritme de la taxa 34

32 d incidència dins de les cohorts, tenint en compte el pes de cada una de les ˆi β, que vindrà donat per la inversa de la variància de cada una d elles: ˆ = i= 1 β W j cvar ˆ ( Q) ˆ β i i i CVar ˆ ( Q) W (22) amb C el nombre total de casos (sumant totes les cohorts) i j 1 Var ˆ ( Q) = cvar ˆ ( Q) (23) W i i C i = 1 seria com la mitjana de les variàncies intracohorts de les mesures dels qüestionaris, ponderades pel nombre de casos que aporta cada cohort. La variància de ˆW β es pot expressar com: ˆ 1 Var( β ) = W CVar ˆ ( Q) (24) W És evident, comparant (21) i (24) que la variància de l estimador pel conjunt de les cohorts serà menor que les variàncies individuals (ja que C>c i ). Per tant, si les diferents ˆi β són relativament similars (mateix efecte en totes les cohorts), combinant-les en ˆW β obtindrem un estimador més eficient per veure la relació entre l exposició i la malaltia. El problema és que aquesta homogeneïtat d efectes entre les diverses cohorts, si fos real, es podria veure amenaçada per la presència de biaixos diferents en les cohorts deguts a variables de confusió, i a la presència de diferents factors que interactuïn amb l exposició que modifiquin la probabilitat de patir la malaltia (modificació de l efecte) (Kaaks 1994a). La inclusió de variables de confusió en el model resoldria el primer punt. La presència de modificadors de l efecte indicaria que els riscos relatius associats a una certa exposició dependrien de característiques individuals distribuïdes diferentment entre les diverses cohorts, el que faria que les ˆi β no fossin combinables 35

33 (Greenland 1987). Una solució a aquest problema seria combinar les diferents ˆi β però en diversos estrats homogenis respecte al modificador de l efecte. La presència d errors de mesura pot ésser una font addicional de variabilitat intercohorts, més encara si s usen diferents tipus de qüestionaris (Kaaks 1994a). L error de mesura, dins de cada cohort, es podria descriure com: Q Q = δ ( T T + ε) (25) i i i nivell ecològic (de grup) el biaix ve donat per Qi Ti. El coeficient δ indicaria el biaix proporcional (per exemple, tendència dels individus amb gran consum a infrareportar el consum). ε seria l error aleatori, independent amb mitjana 0 i variància 2 σ ε. Per millorar la comparabilitat entre cohorts s haurien de corregir els riscos relatius afectats pel biaix d error de mesura (Kaaks 1994a). questa correcció (calibratge) ve donada per: ˆ* ˆ ˆ β = β / λ (26) (λ s estima en una submostra en que es mesura R (en comptes de T), valor estimat no esbiaixat de T [R=T+ε R ], amb ε R i ε independents, fent la regressió entre R i Q). X serien els valors predits (calibrats) a partir d aquesta regressió. La variància del nou estimador corregit ve donada per (Rosner 1989): ˆ Var( ˆ β ) = Var( ˆ β ) + Var( ˆ λ ) (27). 2 * * 1 β i ˆ2 i ˆi 4 i λi λi Si la mostra de calibratge és prou grossa podem assumir que el segon sumand de (27) és gairebé 0, amb la qual cosa usant (21) en (27) podem escriure que: 36

Sitemap