Aplicação das redes neuronais aditivas generalizadas à Medicina

Geraldes, Carlos José Brás

Links

[hdl.handle.net] | PDF

Tools

Export citation

Search in Google Scholar

Aplicação das redes neuronais aditivas generalizadas à Medicina

Published in 2020 by Carlos José Brás Geraldes

This paper is available in a repository.

Full text: Download

Preprint: policy unknown

Upload

Postprint: policy unknown

Upload

Published version: policy unknown

Upload

Abstract

RESUMO: A aplicação das redes neuronais artificiais tem vindo a aumentar em várias áreas de conhecimento, muito em parte devido à flexibilidade que caracteriza estes modelos, e que permite modelar não só dados provenientes de situações reais mais complexas, tais como o reconhecimento de padrões e de voz, mas também dados mais simples como, por exemplo, os que refletem relações entre várias variáveis independentes e uma resposta (variável dependente). Uma arquitetura bastante utilizada é a do Perceptrão Multicamada (MLP), no entanto, apesar da sua popularidade em várias áreas do conhecimento, este modelo é menos utilizado no âmbito clínico do que os Modelos Lineares Generalizados (GLMs) e os Modelos Aditivos Generalizados (GAMs). O principal motivo deve-se ao facto da MLP funcionar de forma opaca quanto à interpretabilidade dos efeitos de cada variável explicativa na resposta. Assim sendo, a aplicação de uma rede neuronal aditiva generalizada (GANN) no âmbito da Medicina é bastante mais promissor uma vez que, além de produzir boas estimativas, também os seus resultados são, à partida, interpretáveis. Por outro lado, no que respeita aos modelos de regressão, vários autores referem que uma má escolha da função de ligação pode afetar, em determinados casos, o desempenho do modelo, pelo que foram desenvolvidos estudos no intuito de melhorar este aspecto através da flexibilização da função de ligação quer de uma forma paramétrica quer não paramétrica. No caso da GANN, dada a exiguidade de estudos sobre esta arquitetura, constatamos que nada foi feito quanto à estimação da função de ligação recorrendo a métodos paramétricos, tornando-se este um dos objetivos deste estudo. Adicionalmente, a estimação da função de ligação recorrendo a métodos não paramétricos também foi sugerida e analisada. Outro objetivo do estudo passou pela introdução de métodos para a determinação de intervalos de confiança das funções parciais e da função da razão de possibilidades de modo a permitir uma melhoria substancial na interpretabilidade deste tipo de rede neuronal. ; ABSTRACT: The application of artificial neural networks has been increasing in many areas of knowledge, much due to the flexibility that features these models and they allow to model data not only from more complex situations, such as pattern recognition and voice data but also simpler such as, for example, those that reflect relationships between multiple independent variables, and a outcome (dependent variable). A widely used architecture is the Multi Layer Perceptron (MLP). However, despite its popularity in several areas of knowledge, this model is less used in the clinical context that the Generalized Linear Models (GLMs) and the Generalized Additive Models (GAMs), due to the fact that, the MLP works as a black box. In the other hand, the Generalized Additive Neural Network (GANN) besides producing good estimates, allows the interpretation of the effect of each covariate on the outcome. Those features makes this type of neural network much more promising in the clinical area. On the other hand, concerning the regression models, several authors have reported that a bad choice of the link function can affect, in some cases, the model performance; so, studies have been developed in order to solve this issue by the introduction of a flexible link function either (parametric or nonparametric). In the case of a GANN, given the low number of studies about this architecture, we find that nothing has been done regarding the estimation of the link function using parametric methods, becoming this one goal of the present study. The link function estimation by using nonparametric methods was also approached. Another goal included the implement of methods for the determination of confidence intervals of the partial functions and the odds ratio function, which substantially improved the interpretability of the results of this type of neural network.