Escola de Regressão

Sessões Temáticas


ST1: “Modelos Assimétricos: A flexibilidade bate às portas da regressão

Coordenadora:  Rosangela H. Loschi (UFMG)

 

Mixtures of restricted skew-t factor analyzers with common factor loadings

- Luis Mauricio Castro Cepero (PUC-Chile)

Joint work with Wan-Lun Wang, Yen-Ting Chang and Tsung-I Lin.

Mixtures of common t factor analyzers (MCtFA) have been shown its effectiveness in robustifying mixtures of common factor analyzers (MCFA) when handling model-based clustering of the high-dimensional data with heavy tails. However, the MCtFA model may still suffer from a lack of robustness against observations whose distributions are highly asymmetric. This paper presents a further robust extension of the MCFA and MCtFA models, called the mixture of common restricted skew-tfactor analyzers (MCrstFA), by assuming a restricted multivariate skew-t distribution for the common factors. The MCrstFA model can be used to accommodate severely non-normal (skewed and leptokurtic) random phenomena while preserving its par-simony in factor-analytic representation and performing graphical visualization in low-dimensional plots. A computationally feasible expectation conditional maximization either algorithm is developed to carry out maximum likelihood estimation. The numbers of factors and mixture components are simultaneously determined based on common likelihood penalized criteria. The usefulness of our proposed model is illustrated with simulated and real datasets, and experimental results signify its superiority over some existing competitors. 

 

Semi-parametric models for heterogeneous degradation data Modelos de degradação semi-paramétricos via processo de Dirichlet 

- Cristiano C. Santos (UFMG)  

Joint work with Rosangela H. Loschi

Degradation data are commonly considered to make reliability assessments in highly reliable systems. General path models are a possible approach to model the degradation behavior. This class of models includes random effects in its structure to account for correlation among the measures in a single unit. Distributions for random effects, which may have a nice interpretation in terms of the degradation rate, are usually specified assuming that degradation comes from homogeneous populations. Homogeneity    can be a strong assumption if there is high variability in the manufacturing process or whenever there is no guarantee that the devices works on similar conditions. We develop a semi-parametric degradation model able to accommodate multimodality in degradation data. That is achieved by assuming a Dirichlet process mixture of both normal and skew-normal distributions for the random effects. We also prove that the proposed model account for multimodality in the lifetime distribution. We carry out simulation studies and data analysis to show the flexibility of the proposed model in modeling skewness, heavy tail and multi-modal behavior of the random effects. 

 

Scale and Shape Mixtures of Multivariate Skew-Normal Distributions

- Reinaldo B. Arellano-Valle (PUC-Chile)

Joint work with Clécio S. Ferreira  (UFJF), Marc G. Genton (KAUST-Arabia Saudita). 

We introduce a broad and flexible class of multivariate distributions obtained by both scale and shape mixtures of multivariate skew-normal distributions. We present the probabilistic properties of this family of distributions in detail and lay down the theoretical foundations for subsequent inference with this model. In particular, we study linear transformations, marginal distributions, selection representations, stochastic representations and hierarchical representations. We also describe an EM-type algorithm for maximum likelihood estimation of the parameters of the model and demonstrate its implementation on a wind dataset. Our family of multivariate distributions unifies and extends many existing models of the literature that can be seen as submodels of our proposal. 

 

ST2: “Avanços em modelos  de regressão série de potência

Coordenador: Carlos Alberto Ribeiro Diniz (UFSCar)


Palestrantes:

Carlos Alberto Ribeiro Diniz (UFSCar)

Katiane Silva Conceição (ICMC/USP)

Marinho Gomes de Andrade Filho (ICMC/USP)


Resumo:

Análise de dados de contagem ocupa uma posição de destaque dentro da estatística aplicada, uma vez que muitos problemas reais envolvem dados desta natureza. Em alguns casos, na prática, a quantidade de uma determinada observação no conjunto de dados é maior (inflação)  ou  menor  (deflação)  que  o  esperado  ao  considerarmos certas  distribuições discretas. Consequentemente, torna-se  inadequada  a  suposição desta distribuição nestas situações.  Neste contexto, distribuições mais gerais devem ser  usadas.  Nesta sessão temática discutiremos extensões em modelos de regressão envolvendo a família de distribuição série de potência para dados de contagem com discrepência em uma determinada observação.  Entre os trabalhos apresentados discutiremos modelos de regressão k-modificados; modelos de regressão autorregressivo inflacionados de zero; e modelo zero-modificado com efeito aleatório para dados longitudinais. Devido à grande quantidade de problemas reais envolvendo modelos de regressão para dados de contagem, é importante o desenvolvimento de novos modelos, capazes de explicar satisfatoriamente o comportamento de conjuntos de dados com diferentes características. Assim, justifica-se a proposta dessa sessão.

 

ST3: “Recentes avanços na análise de sobrevivência

Coordenadores: Vera Tomazella (UFSCar) e Enrico Colosimo (UFMG)

 

Zero-adjusted defective regression models for modelling lifetime data

- Vinicius Fernando Calsavara ( A.C.Camargo Cancer Center, Centro Internacional de Pesquisa)

We introduce a defective regression model for survival data modeling with a proportion of early failures or zero-adjusted. Our approach enables us to accommodate three types of units, that is, patients with “zero”' survival times (early failures) and those who are susceptible or not susceptible to the event of interest. Defective distributions are obtained from standard distributions by changing the domain of the parameters of the latter in such a way that their survival functions are limited to pϵ(0,1). We consider the Gompertz and inverse Gaussian defective distributions, which allow modeling of data containing a cure fraction. Parameter estimation is performed by maximum likelihood estimation, and Monte Carlo simulation studies are conducted to evaluate the performance of the proposed models. We illustrate the practical relevance of the proposed models on two real data sets. The first is from a study of occlusion of endoscopic stenting in patients with pancreatic cancer performed at A.C.Camargo Cancer Center, and the other is from a study on insulin use in pregnant women diagnosed with gestational diabetes performed at São Paulo University Medical School. Both studies were performed in São Paulo, Brazil.

 

Aplicação do Modelo Poisson Birnbaum Saunders Reparametrizado em Dados de Fadiga

- Elizabeth Mie Hashimoto (Departamento Acadêmico de Matemática – UTFPR)

Joint work with Janaína Fracaro de Souza Gonçalves (Departamento Acadêmico de Mecânica – UTFPR), Milena Chanes e Souza (Centro de Competência em Manufatura – ITA)

Componentes mecânicos submetidos a uma carga cíclica estão sujeitos a eventuais falhas. Por essa razão, pesquisas são realizadas para avaliar o quanto um componente pode ser resistente.  Nesse contexto, o objetivo do estudo foi avaliar o efeito da força (kN) aplicado sobre o componente e a presença de rebarba. Dessa forma, os dados foram obtidos por meio de um experimento conduzido no Instituto Tecnológico de Aeronáutica e analisados utilizando um modelo de tempo promoção Poisson Birnbaum-Saunders reparametrizado. Os resultados da análise mostraram que, ao nível de significância de 5%, não há diferença significativa entre os corpos de prova com e sem rebarba. Por outro lado, a cada 1kN que aumentamos no nível de stress, esperamos uma redução de aproximadamente 9% no tempo de vida. Agora, considerando uma força maior do que 12kN, menos de 0,16% dos corpos de prova não são suscetíveis a falha. Por fim, concluímos que o modelo de tempo-promoção Poisson Birnbaum-Saunders reparametrizado é útil para analisar o efeito de variáveis explicativas no tempo de vida médio sem a necessidade da transformação logarítmica na variável resposta. Além disso, por meio do modelo, foi possível mostrar que a força reduz o tempo de vida dos corpos de prova e também diminui a proporção de corpos de provas não susceptíveis ao evento de interesse.

 

Log-symmetric regression models with allowance for correlated errors applied to mortality data

- Helton Saulo (Universidade de Brasilia-UnB)

Joint work with Roberto Vila - UnB

Log-symmetric regression models are particularly useful when the response variable is continuous, strictly positive and asymmetric. In this paper, we proposed a class of log-symmetric regression models in the context of correlated errors. The proposed models provide a novel alternative to the existing log-symmetric regression models due to its flexibility in accommodating correlation. We discuss some properties, parameter estimation by the conditional maximum likelihood method and goodness of fit of the proposed model. We also provide expressions for the observed Fisher information matrix. A Monte Carlo simulation study is presented to evaluate the performance of the conditional maximum likelihood estimators. Finally, a full analysis of a real-world mortality data set is presented to illustrate the proposed approach. 

 

ST4: “Inovação e Transferência de Tecnologia em  Estatística - Parte I

Sessão Temática proposta pelo CEPID – CeMEAI – Centro de Ciências Matemáticas Aplicadas à Indústria)

Coordenadores: Francisco Louzada (ICMC/USP)


Palestrantes:

Francisco Louzada (ICMC/USP)

Júlio M. Stern (IME-USP)

Marcelo Lauretto (USP Leste)


Resumo:

O Centro de Matemática e Estatística Aplicada à Indústria (CeMEAI) tem como missão o fornecimento de amplos recursos e mecanismos para conectar cientistas, engenheiros, matemáticos, estatísticos e especialistas em computação em um ambiente colaborativo e envolvente. Seus principais objetivos são formar recursos humanos de alto nível, desenvolver novas técnicas matemáticas e estatísticas transformadoras e explorar suas aplicações em benefício da sociedade e das indústrias e instituições nacionais. Nesta sessão temática, serão apresentadas várias metodologias estatísticas, desenvolvidas a partir de problemas reais no setor produtivo, financeiro e médico, conduzidas por pesquisadores do CeMEAI.

 

ST5 - "Inovação e Transferência de Tecnologia  em Estatística - Parte II"

Coordenadora: Gleici da Silva Castro Perdoná

Palestrantes:

Osvaldo Anacleto (ICMC-USP)

Nikolai Kolev (IME-USP)

Gleici da Silva Castro Perdon´a (FMRP-USP)


Resumo:

O Centro de Matemática e Estatística Aplicada à Indústria (CeMEAI) tem como missão o fornecimento de amplos recursos e mecanismos para conectar cientistas, engenheiros, matemáticos, estatísticos e especialistas em computação em um ambiente colaborativo e envolvente. Seus principais objetivos são formar recursos humanos de alto nível, desenvolver novas técnicas matemáticas e estatísticas transformadoras e explorasuas aplicações em benefício da sociedade e das indútrias e instituições nacionais. Nesta sessão temática, serão apresentadas várias metodologias estatísticas, desenvolvidas a partir de problemas reais no setor produtivo, financeiro e médico, conduzidas por pesquisadores do CeMEAI.

 

ST6 - A definir

Coordenador: ...
Palestrantes: 
...


Resumo: ...