選單

量化投資策略:Catboost演算法選股

CatBoost這個名字來自兩個詞“Category”和“Boosting”。如前所述,該庫可以很好地處理各種類別型資料,是一種能夠很好地處理類別型特徵的梯度提升演算法庫。CatBoost是俄羅斯的搜尋巨頭Yandex在2017年開源的機器學習庫,是Boosting族演算法的一種。

量化投資策略:Catboost演算法選股

CatBoost和XGBoost、LightGBM並稱為GBDT的三大主流神器,都是在GBDT演算法框架下的一種改進實現。XGBoost被廣泛的應用於工業界,LightGBM有效的提升了GBDT的計算效率,而Yandex的CatBoost號稱是比XGBoost和LightGBM在演算法準確率等方面表現更為優秀的演算法。

模型構建與回測

我們選擇滬深300和中證500作為股票池,計算88個因子作為樣本特徵值,然後進行去極值,標準化,中性化處理。按月計算個股收益,收益率前30%的標註為1,後30%為-1。使用CatBoostClassifier演算法進行模型訓練和預測,其中2016年5月到2018年12月資料進行訓練,預測2019年1月到2022年3月的股票表現。每個月為一個週期等權重買入預測值為1的股票,持有到下個換股週期。

中證500模型收益157%,同期指數50%,超額107%,夏普比率1。38,最大回撤20%

滬深300模型收益90%,同期指數40%,超額50%,夏普比率0。99,最大回撤29%