實(shí)驗(yàn)室在《Analytica Chimica Acta》發(fā)表非靶向代謝組學(xué)數(shù)據(jù)分析方法領(lǐng)域的研究成果
西南特色中藥資源國(guó)家重點(diǎn)實(shí)驗(yàn)室胡凱鋒團(tuán)隊(duì)在非靶向代謝組學(xué)數(shù)據(jù)分析方法研究中取得進(jìn)展。相關(guān)成果以“Comparing univariate filtration preceding and succeeding PLS-DA analysis on the differential variables/metabolites identified from untargeted LC-MS metabolomics data”為題,于2024年1月25日在線發(fā)表于《Analytica Chimica Acta》雜志。西南特色中藥資源國(guó)家重點(diǎn)實(shí)驗(yàn)室為第一通訊作者單位,中醫(yī)藥創(chuàng)新研究院/交叉學(xué)科研究院胡凱鋒教授為通訊作者,基礎(chǔ)醫(yī)學(xué)院2020級(jí)博士研究生許愫蕓和基礎(chǔ)醫(yī)學(xué)院博士后柏彩紅為本文共同第一作者。
在非靶向代謝組學(xué)研究中,單變量分析和多變量分析通常被整合使用,旨在篩選高維數(shù)據(jù)中與樣本分類有顯著意義的差異變量(特征或代謝物),從而揭示生物標(biāo)志物、疾病發(fā)病機(jī)理和藥物作用機(jī)制。偏最小二乘判別分析是非靶向代謝組學(xué)研究中常用的多變量分析方法之一。然而,對(duì)于同一組非靶向代謝組學(xué)LC-MS數(shù)據(jù),在PLS-DA之前進(jìn)行單變量分析或在PLS-DA之后進(jìn)行單變量分析(MVA/UVA)可能會(huì)產(chǎn)生不同的代謝組學(xué)結(jié)果。該研究使用血清數(shù)據(jù)集和線蟲數(shù)據(jù)集探究了UVA/MVA和MVA/UVA兩種不同的數(shù)據(jù)分析方案產(chǎn)生不一致的差異變量的原因。
該研究發(fā)現(xiàn),LC-MS數(shù)據(jù)中存在大量無關(guān)變量的波動(dòng)和正交噪聲可能會(huì)扭曲PLS-DA構(gòu)建的模型,影響p(corr)值,并由于模型構(gòu)建中輸入變量的總數(shù)增加,使得計(jì)算出的相關(guān)特征的VIP通常偏大。研究結(jié)果表明,針對(duì)非靶向代謝組學(xué)LC-MS數(shù)據(jù),在PLS-DA之前進(jìn)行單變量數(shù)據(jù)預(yù)過濾,通常會(huì)得到數(shù)目更少但更穩(wěn)健可靠的差異特征。而直接PLS-DA分析包含大量噪音或測(cè)量波動(dòng)的LC-MS數(shù)據(jù),可能會(huì)產(chǎn)生扭曲的PLS-DA模型,并造成相關(guān)變量的VIP值膨大。導(dǎo)致采樣常用的VIP最小閾值(1.0)篩選差異變量將產(chǎn)生更多的假陽(yáng)性結(jié)果。因此,如果PLS-DA之前未經(jīng)單變量預(yù)過濾,建議提高篩選差異變量的VIP閾值,有助于降低假陽(yáng)性率。
該研究獲得國(guó)家自然科學(xué)基金(22374012, 32171440)和四川省自然科學(xué)基金(2022NSFSC0719)支持。
全文鏈接:https://doi.org/10.1016/j.aca.2023.342103