當前位置: 首頁 >> 科研 >> 正文

雲南省統計建模與數據分析重點實驗室科研工作取得重要進展

2021-06-07  點擊:[]

近期,雲南省統計建模與數據分析重點實驗室唐年勝團隊在各類研究領域取得了一系列進展,針對複雜抽樣調查數據、醫學統計及人工智能開展了大量的科學研究,2020年以來連續在統計學國際頂級期刊Journal of Royal Statistical Society: Series B” “Journal of the Ameirican Statistical Association”、計量經濟學國際頂級期刊“Journal of Econometrics”、人工智能權威期刊“Journal of Machine Learning Research”等上發表學術論文,在複雜抽樣調查數據的貝葉斯分析、半參數估計方程估計方法及理論、動態推薦系統、個性化醫療推薦等方向取得了重要進展。

在複雜抽樣調查數據的貝葉斯分析的研究方面,唐年勝團隊中趙普映副教授在統計學國際頂級期刊“Journal of Royal Statistical Society: Series B”Journal of Royal Statistical Society: Series B202082, Part 1, pp.155–174//doi.org/10.1111/rssb.12342IF3.965)上發表題為“Bayesian Empirical Likelihood Inference With Complex Survey Data”文章。文章發展了複雜抽樣調查設計下關於廣義估計方程的半參數貝葉斯經驗似然估計、半參數貝葉斯經驗似然置信區間以及半參數貝葉斯經驗似然模型選擇準則,並提出了有效且計算方便的馬爾可夫鏈蒙特卡羅(MCMC)算法。在一些正則條件下,文章證明了新提出的基於設計的半參數貝葉斯經驗似然後驗分佈滿足“Bernstein–von Mises定理、基於設計的半參數貝葉斯經驗似然推斷的有效性以及半參數貝葉斯經驗似然模型選擇準則的選擇相合性。論文提出的基於設計的半參數貝葉斯方法能充分融合數據及先驗分佈的信息以達到改進統計推斷的目的、能靈活整合估計過程中涉及到的約束條件、不需要假定任何參數分佈或模型,從而是具有較強普適性的貝葉斯統計分析新方法。此外,文章提出的基於設計的統計推斷方法為處理非獨立同分布類型數據提供了新思想。

在複雜抽樣調查數據的半參數估計方程估計方法及理論的研究方面,唐年勝團隊中趙普映副教授在計量經濟學國際頂級期刊“Journal of Econometrics”(Journal of Econometrics, 2020216, 516-536//doi.org/10.1016/j.jeconom.2019.11.003IF1.577)上發表題為“Survey Weighted Estimating Equation Inference With Nuisance Functionals”文章。文章研究了複雜抽樣調查設計下具有較強普適性的半參數估計方程估計方法及理論。半參數估計方程包含了一系列半參數統計模型,其在統計學和經濟學領域均有廣泛的應用場景。由於半參數估計方程可能非光滑且涉及無窮維的討厭參數,導致這類模型的研究難度很大,特別具有理論挑戰性。針對半參數估計方程統計推斷問題,文章發展了基於設計的兩步經驗似然方法和兩步廣義矩估計方法,並提出了複雜抽樣設計下針對兩步調查加權半參數估計方程的Multiplier Bootstrap漸近方差估計方法。文章提出的基於設計的半參數估計方程估計方法及理論進一步為處理非獨立同分布類型數據提供了新思想。特別地,新方法和新理論適用於解決基尼係數、洛倫茲曲線、收入份額以及其它經濟不平等度量指標的統計推斷問題,從而具有重要的經濟學研究意義。

在動態推薦系統的研究方面,唐年勝團隊中張豔青研究員在人工智能權威期刊“Journal of Machine Learning Research”Journal of Machine Learning Research202122(65):135//jmlr.org/papers/v22/19-792.htmlIF3.484)上發表題為“Dynamic Tensor Recommender Systmes”文章,提出了時間張量函數下的動態推薦系統,解決了動態推薦系統的預測問題及區間估計問題。

推薦系統已被廣泛應用於娛樂業、商業營銷和生物醫藥行業。除了作為一種無監督的學習方法提供基於偏好的建議外,它還被證明在銷售預測、產品推薦中很有用。由於一些消費者和企業需要為未來的預算、勞動力和供應鏈協調提供一個建議或預測,因此,能實現精確預測的動態推薦系統變得非常必要。課題組利用時間的張量值函數來整合時間和上下文信息,提出了一種新的推薦方法,即動態張量推薦系統。該方法通過多項式樣條逼近建立時間張量分解的時變係數模型,實現了未來推薦建議的精準預測及獲得有效的預測區間估計。從理論上,證明了所提出的張量分解方法的收斂速度和樣條係數估計的漸近正態性。並且,將該方法應用於仿真數據、IRI營銷數據和Last.fm數據的分析中。

在個性化醫療推薦的研究方面,唐年勝團隊中張豔青研究員在統計學頂級期刊“Journal of the American Statistical Association”(Journal of the American Statistical Association2021:1-14DOI:10.1080/01621459.2020.1862671//www.tandfonline.com/doi/full/10.1080/01621459.2020.1862671IF3.989)上發表題為“Multicategory Angle-Based Learning for Estimating Optimal Dynamic Treatment Regimes With Censored Data”文章,提出了針對動態多分類治療方案的個性化醫療推薦方法,以推薦最優的治療方案,從而最大限度延長慢性病的生存時間。

個性化醫療能為病人量身設計最佳治療方案,以達到治療效果最大化或副作用最小化。而針對癌症或HIV感染等慢性疾病的病人個體,一種最佳的動態治療方案能使病人的生存時間達到最大化。課題組針對慢性疾病中多分類治療方案的多階段推薦問題,提出了一種生存數據下基於角度方法的最優動態治療方案推薦方法。與現有的二分類治療方案下最大化期望生存時間的方法不同,所提出的方法有效解決了刪失數據下多階段多分類治療推薦的問題。在理論上,建立了Fisher相合性,並給出了正則條件下估計量的風險界。

供稿:數學與統計學院

編輯:李哲

責任編輯:曾文蕊


上一條:生態與環境學院謝平團隊發表... 下一條:雲南大學張志剛團隊合作揭示...

【晉越集運app下載】

最新文章

Copyright © 2006-2020 雲南大學黨委宣傳部(含新聞中心) 版權所有 未經雲南大學授權,請勿轉載新聞文字、圖片或建立網站鏡像,違者依法必究  雲南大學新聞網設計開發 Stat.By 站長統計