當前位置: 首頁 ? 資訊 ? 科普博覽 ? 科技博覽 ? 正文

科技名詞 | 集成學習 ensemble learning

發(fā)布日期:2023-10-26??來源:全國科學技術(shù)名詞審定委員會??瀏覽次數(shù):738
放大字體??縮小字體
核心提示:集成學習ensemble learning定義:通過結(jié)合多個學習器來解決問題的一種機器學習范式。其常見形式是利用一個基學習算法從訓練集產(chǎn)生多個基學習器,然后通過投票等機制將基學習器進行結(jié)合。代表性方法包括Boosting、Bagging等。學科:計算機科學技術(shù)_人工智能_機器學習相關(guān)名詞:機器學習 決策樹 圖像識別圖片來源:視覺中國【延伸閱讀】集成學習是一種機器學習方法


集成學習

ensemble learning

定義:通過結(jié)合多個學習器來解決問題的一種機器學習范式。其常見形式是利用一個基學習算法從訓練集產(chǎn)生多個基學習器,然后通過投票等機制將基學習器進行結(jié)合。代表性方法包括Boosting、Bagging等。

學科:計算機科學技術(shù)_人工智能_機器學習

相關(guān)名詞:機器學習 決策樹 圖像識別

圖片來源:視覺中國

【延伸閱讀】

集成學習是一種機器學習方法,它通過將多個基本的學習模型(也被稱為基學習器)組合成一個強大的學習系統(tǒng)來提高模型的性能。集成學習的基本思想可以概括為“多樣性和投票”,即通過構(gòu)建多個基學習器,并讓它們對輸入數(shù)據(jù)進行獨立的預測,然后通過某種方式將各個基學習器的預測結(jié)果結(jié)合起來,產(chǎn)生一個最終的預測結(jié)果。這樣做的好處是,各個基學習器可以各自在不同的特征子集或者在不同的模型空間進行學習,從而降低模型的泛化誤差。

集成學習的概念可以追溯到20世紀90年代初期,但真正引起人們關(guān)注是在2000年以后。根據(jù)個體學習器的生成方式,目前的集成學習方法大致可分為兩大類:一類是個體學習器間存在強依賴關(guān)系、必須串行生成的序列化方法,如Boosting(自適應(yīng)提升);另一類是個體學習器間不存在強依賴關(guān)系、可同時生成的并行化方法,如Bagging(自助投票)和隨機森林。其中,Boosting是一族可將弱學習器提升為強學習器的算法,主要是通過對樣本集的操作獲得樣本子集,然后用弱分類算法在樣本子集上訓練生成一系列的基分類器;Bagging是一種基于數(shù)據(jù)隨機重抽樣的集成學習方法,它通過從原始數(shù)據(jù)集中有放回地抽取樣本來訓練多個基分類器,并對所有基分類器的預測結(jié)果進行平均或投票來產(chǎn)生最終的預測結(jié)果;隨機森林是Bagging的一個擴展變體,它在以決策樹為基學習器構(gòu)建Bagging集成的基礎(chǔ)上,進一步在決策樹的訓練過程中引入了隨機屬性選擇。

集成學習的應(yīng)用非常廣泛,例如圖像識別、文本分類、金融風險評估、生物信息提取、醫(yī)療診斷等。在圖像識別方面,可以用于目標檢測、語義分割等任務(wù);在文本分類方面,可以用于情感分析、垃圾郵件過濾等任務(wù);在金融風險評估方面,可以用于信用評分、欺詐檢測等任務(wù);在生物信息學中,可從海量基因組數(shù)據(jù)中提取有用信息;在醫(yī)療診斷方面,可用來提高疾病診斷的準確度。

(延伸閱讀作者:西華師范大學數(shù)學與信息學院 李斌斌博士)

責任編輯:張鵬輝

?
?
[ 資訊搜索 ]? [ 加入收藏 ]? [ 打印本文 ]? [ 違規(guī)舉報 ]? [ 關(guān)閉窗口 ]

免責聲明:
本網(wǎng)站部分內(nèi)容來源于合作媒體、企業(yè)機構(gòu)、網(wǎng)友提供和互聯(lián)網(wǎng)的公開資料等,僅供參考。本網(wǎng)站對站內(nèi)所有資訊的內(nèi)容、觀點保持中立,不對內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權(quán)等問題,請及時聯(lián)系我們,我們將在收到通知后第一時間妥善處理該部分內(nèi)容。



?
?

?
推薦圖文
推薦資訊
點擊排行
最新資訊
友情鏈接 >> 更多