2022
2023

Sesiones Próximas



Sesiones Anteriores


SEMESTRE 1
10 mayo 2023 Momin M. Malik (Mayo Clinic)
Hora: 12:30 PM
Ponente(s): Momin M. Malik (Mayo Clinic)
Titulo: Generalizability, meaningfulness, and meaning: Machine learning in the social world
Resumen:

Drawing on a wide range of literature, I present a guide for how to think about the context of applying machine learning to people. Layers of implicit assumptions underlie the ability of machine learning to achieve real-world performance like that of evaluation on test sets, assumptions that can and do fail particularly around people and society, to the surprise and dismay of those who do not reason about the larger context. I cover failures of measurement and quantification understandable mainly in qualitative terms; causal mismatches understandable in econometric or structural causal model terms; and a lack of uncertainty quantification of performance on a test set, and bias from dependencies between training and test sets, understandable in statistical terms of asymptotic behavior. I conclude with remarks about the importance of reflecting on ourselves and our practice towards being able to have a deliberate, positive impact in the world with quantitative tools.


Enlace de transmisión: https://bluejeans.com/879319197
03 mayo 2023 Javier Rubio (U College London, UK)
Hora: 12:30 PM
Ponente(s): Javier Rubio (U College London, UK)
Titulo: Flexible Excess Hazard Modelling with Applications in Cancer Epidemiology
Resumen:

Excess hazard modelling is one of the main tools in population-based cancer survival research. This setting allows for direct modelling of the survival due to cancer in the absence of reliable information on the cause of death, which is common in population-based cancer epidemiology studies. We propose a unifying link-based additive modelling framework for the excess hazard that allows for the inclusion of many types of covariate effects, including spatial and time-dependent effects, using any type of smoother, such as thin plate, cubic splines, tensor products and Markov random fields. Three case studies that illustrate the type of applications of interest in practice will be presented. We will conclude with a discussion on available software tools (in R), as well as a general discussion on the use of the relative survival framework.


Enlace de transmisión: https://bluejeans.com/879319197
26 abril 2023 Vladimir Rodríguez Caballero (ITAM)
Hora: 12:30 PM
Ponente(s): Vladimir Rodríguez Caballero (ITAM)
Titulo: Expecting the unexpected: Economic growth under stress
Resumen:

We construct the US conditional growth densities under stressed factor scenarios and propose a vulnerability index, Growth-in-Stress (GiS), to assess the level of exposure of the economy to small probability but potentially catastrophic events. The choice of severe yet plausible stress scenarios is based on the joint probability distribution of the driving factors of growth. The factors are extracted with a multi-level Dynamic Factor Model (DFM) from a wide set of local and worldwide macroeconomic and financial variables. All together, we provide a risk management tool that allows for a complete visualization of growth dynamics under average and probabilistic stressed scenarios where warning signals are coming from the quantiles in the left tails of the average and stressed growth densities. We show that GiS is a useful and complementary tool to Growth-at-Risk (GaR) for policy makers wishing to carry out a multi-dimensional scenario analysis and illustrate their implementation in the context of the COVID19 pandemic.


Enlace de transmisión: https://bluejeans.com/879319197
19 abril 2023 Albert Akuno (CIMAT)
Hora: 12:30 PM
Ponente(s): Albert Akuno (CIMAT)
Titulo: Inference on a multi-patched epidemic model with partial mobility, residency, and demography: the case of COVID-19 outbreak in Hermosillo, Mexico
Resumen:

In December 2019, the initial case of the COVID-19 pathogen was domiciled within the geographical boundaries of Wuhan, China. However, within a span of three months, the virus had caused immense social, economic and health damages to the point of being declared a pandemic by the WHO on March 11, 2020. Even though the exact nature of the contagion remained unclear, there was recognition of the undeniable interplay between human mobility and the swift spread of the virus to an important proportion of the world. Quantification of the role of human mobility on the propagation dynamics of COVID-19 is thus indispensable. Most studies modelling population mobility and the spread of infectious diseases, particularly using meta-population-multi-patched models, tend to focus on theoretical properties and numerical simulations of such models. There is relatively scanty literature published on the fitting and uncertainty quantification on epidemic models with population mobility. Epidemic models, especially those modelling population mobility, are often large scale complex systems faced with a plethora of challenges and uncertainty due to imperfect epidemiological data, stochasticity and model structural discrepancy. Consequently, good and adequate treatment of uncertainty in such models is paramount in order to have a strong and reliable platform for sound and robust decision-making regarding the management of current and future epidemics. In this research, we have used three estimation techniques to perform inference and uncertainty quantification on a human mobility-based multi-patched epidemic model, using mobile phone sensing data and COVID-19 confirmed positive cases in Hermosillo, Mexico. First, we have utilized a Brownian bridge model using mobile phone GPS data to estimate residence and mobility parameters of the epidemic model. In the second step, we have estimated the optimal model epidemiological parameters by deterministically inverting the model. The third part of the analysis involves performing inference and uncertainty quantification on the epidemic model using Hamiltonian Monte Carlo (HMC) sampling method. The results show that the estimated model parameters and incidence adequately fit the observed daily COVID-19 incidence in Hermosillo.


Enlace de transmisión: https://bluejeans.com/879319197
15 marzo 2023 Edgar Jiménez Peña (CIMAT)
Hora: 12:30 PM
Ponente(s): Edgar Jiménez Peña (CIMAT)
Titulo: Propuestas de algoritmos para la visualización de datos faltantes en series longitudinales
Resumen:

El análisis de grandes cantidades de datos longitudinales requiere herramientas rápidas exploratorias para garantizar la calidad de los datos y encontrar patrones útiles para el análisis en etapas posteriores. Mostraremos en esta plática algoritmos basados en ordenamiento, muestreo y agrupación aplicados a gráficos de lasaña, un tipo especial de gráfico de matriz, que son mapas de calor creados para visualizar estudios longitudinales. Estos algoritmos pueden aplicarse a grandes conjuntos de datos para encontrar patrones de interés, monótonos e intermitentes, en los datos faltantes con un costo computacional bajo en comparación con las alternativas anteriores. La visualización con estos algoritmos aborda un equilibrio en el diseño de la visualización: reducir el desorden visual contra aumentar el contenido de información en una visualización. Para ver la efectividad, aplicaremos estos algoritmos a cuatro conjuntos de datos del mundo real de diferentes orígenes (comercio, seguimiento médico) y tamaños (miles-cercanos al millón) que comparten tareas de análisis y visualización y discutimos los patrones encontrados dentro de ellos.


Enlace de transmisión: https://bluejeans.com/879319197
08 marzo 2023 Rolando de la Cruz (Universidad Adolfo Ibáñez)
Hora: 12:30 PM
Ponente(s): Rolando de la Cruz (Universidad Adolfo Ibáñez)
Titulo: A Bayesian nonparametric model for classification of longitudinal profiles
Resumen:

Across several medical fields, developing an approach for disease classification is an important challenge. The usual procedure is to fit a model for the longitudinal response in the healthy population, a different model for the longitudinal response in the diseased population, and then apply Bayes’ theorem to obtain disease probabilities given the responses. Unfortunately, when substantial heterogeneity exists within each population, this type of Bayes classification may perform poorly. In this article, we develop a new approach by fitting a Bayesian nonparametric model for the joint outcome of disease status and longitudinal response, and then we perform classification through the clustering induced by the Dirichlet process. This approach is highly flexible and allows for multiple subpopulations of healthy, diseased, and possibly mixed membership. In addition, we introduce a Markov chain Monte Carlo sampling scheme that facilitates the assessment of the inference and prediction capabilities of our model. Finally, we demonstrate the method by predicting pregnancy outcomes using longitudinal profiles on the human chorionic gonadotropin beta subunit hormone levels in a sample of Chilean women being treated with assisted reproductive therapy (joint work with J.T. Gaskins and C. Fuentes).


Enlace de transmisión: https://bluejeans.com/879319197
08 febrero 2023 Emmanuel Ambriz (CIMAT)
Hora: 12:30 PM
Ponente(s): Emmanuel Ambriz (CIMAT)
Titulo: Estimación de cópulas condicionales bivariadas no simplificadas mediante mezclas de cópulas parciales
Resumen:

En la última década, los modelos Vine Cópula se han popularizado como herramienta importante en la modelación de estructuras complejas de dependencia en alta dimensión. Sin embargo, la especificación y estimación de estos modelos dependen del supuesto simplificador, i.e. que todas las cópulas bivariadas condicionales no dependen de los valores de las variables sobre las que están condicionadas. Por otro lado, las propuestas actuales de modelos no simplificados tienen limitaciones conceptuales o computacionales cuando la dimensión en el condicionante crece. Lo que abre una discusión central en torno a los alcances y limitaciones del supuesto simplificador, así como sobre la construcción de modelos no simplificados. En esta charla presentamos una propuesta de estimación de cópulas condicionales bivariadas no simplificadas mediante mezclas de cópulas parciales; una cópula parcial es la esperanza de cópulas condicionales sobre las variables del condicionante. La determinación de las cópulas en la mezcla se conduce mediante un árbol de decisión de tal manera que se busca aproximar el grado de dependencia condicional observado. El uso de un árbol de decisión hace que la estimación sea computacionalmente factible para dimensiones altas.


Enlace de transmisión: https://bluejeans.com/879319197
01 febrero 2023 Isaias Ramírez Bañales (CIMAT)
Hora: 12:30 PM
Ponente(s): Isaias Ramírez Bañales (CIMAT)
Titulo: Representación paramétrica basada en cópulas para sismos fuertes en la costa de Guerrero
Resumen:

En este trabajo se presenta una modelación de sismos basada en la densidad espectral de un proceso estocástico usando cópulas y la teoría de procesos oscilatorios, que es consistente con el espectro de respuesta y que permite realizar simulaciones del acelerograma de un sismo.La intención de usar la densidad espectral es poder describir el sismo en términos de frecuencia y tiempo simultáneamente, de esta manera evitamos el supuesto simplificador de trabajar al proceso como homogéneo en el tiempo, supuesto habitual en la bibliografía actual sismológica.La transformada de Fourier de tiempo reducido puede ser usado para estimar la densidad de potencia espectral evolutiva (evolutionary power spectral density function, ePSDF), la cual es una función no negativa e integrable; es por ello que una vez normalizada la ePSDF puede ser aproximada con una función de densidad de probabilidad en dos dimensiones. De esta forma podemos modelar fácilmente la liberación de energía en tiempo y frecuencia, mientras que para recuperar la relación conjunta nos basamos en la teoría de cópulas.La modelación que hemos realizado es compatible con leyes de atenuación para la amplitud de espectro y envolventes para las ondas sísmicas, por lo cual puede ser fácilmente adaptada para modelos locales de análisis de riesgo sísmico.


Enlace de transmisión: https://bluejeans.com/879319197
25 enero 2023 Antonio Capella (IMATE)
Hora: 12:30 PM
Ponente(s): Antonio Capella (IMATE)
Titulo: El modelo AMA usado por el gobierno federal para predicción de brotes epidémicos de COVID19 desde Abril 2020
Resumen:

Durante la pandemia desarrollamos el modelo AMA que fue usado por el gobierno federal para predicción de la presión hospitalaria de los brotes epidémicos de COVID19 desde Abril 2020. El objetivo de los era hacer pronósticos probabilistas de la ocupación hospitalaria. En esta platica presentaremos de forma cronológica los diferentes modelos desarrollados y recapitularemos las lecciones aprendidas en este proceso que duro dos años. Coautores: Marcos Capistrán, Andrés Christen, Mary Daza Torres.


Enlace de transmisión: https://bluejeans.com/879319197