【中文】使用中文的朋友，一起聊聊

autratec · June 25, 2021, 7:18am

Chinese Content:

新开一个帖子。让使用中文的朋友一起聊聊 NUMERAI 以及 SIGNAL. 互相协助，共同进步。

restrading · June 25, 2021, 7:47am

大陆现在严管影响你们资金进出和参与竞赛么？

autratec · June 25, 2021, 7:49am

哈哈。找到一个使用中文的朋友了。我在新加坡。

zhangxiang · June 25, 2021, 8:19am

来了，正在入门中，这个能真金白银的干吗？出入金怎么搞啊

autratec · June 25, 2021, 8:23am

Chinese content:

从现在的系统表现看，好像可以真金白银的干。NMR 可以出金到个人的钱包。如何到个人的银行账户，就看自己的造化了。不过还没点到点试过。

zhangxiang · June 25, 2021, 9:02am

可以，准备开搞，这个有对接实时（美股）股票市场还是虚拟币？

zhangxiang · June 25, 2021, 9:26am

emmmm 放弃了，不准备搞了，我还是回去A股量化吧，这个还要注册用AWS

autratec · June 25, 2021, 9:44am

chinese content.

可以先从 Tournament 开始。市场数据已经准备了。只需要自己搞一个后台的计算模型，每周发送预测就可以。我用 AZURE ML STUDIO (free) 就可以了。至于 SIGNAL 讯号，可以慢慢来。这个对全程的数据处理，要求会高一点。

xiafanaina · June 27, 2021, 5:18am

给力啊,终于有中文的了.同志们互相分享一起起飞啊

autratec · June 27, 2021, 6:10am

Chinese

有什么问题，可以讨论一下。

yxbot · June 30, 2021, 9:42am

潜水的，冒个泡。
祝各位NMR财源广进

autratec · June 30, 2021, 10:47am

Chinese 希望以太币和 NMR 的价格能稳住。不要太低或太高。

slyfox · July 2, 2021, 2:04am

歡迎你們😬 我是Numerai的CTO. 重香港長大但中文不太好。請多多指教。

有什麼我能幫忙或解釋的地方可以直接問我

autratec · July 2, 2021, 2:39am

感谢回复。接触 numerai 几周时间，但从各位的零零碎碎的回复中，学到很多东西。也感谢论坛一路来的支持。

yxbot · July 2, 2021, 3:28pm

老kaggle发烧友，从2016/2017年开始关注Numerai, 20+个features的时候玩过一段时间后就断了几年回去kaggle上继续比赛了。不过这几年一直有关注Numerai的进展，觉得skin in the game是个非常有革命性的概念。

去年好朋友看玩得很好，很是羡慕 - 所以今年几个月前我自己有开始入坑了。现在从数据上，比赛的形式上，社区的建设上，觉得都做得很好。和几年前比觉得是进步真是很大的。

以后会继续积极参与

xiafanaina · August 9, 2021, 3:08am

请问大家有什么好的方法提高模型表现么?我先分享一下我做的:

用optuna来进行超参数调参,这个对模型表现提升很大
把feature的value distribution分类(大概有14个distribution),然后每个distribution都加入random noise,通过MDI,和SHAP来做feature selection.筛选完最后只用了140多个feature,模型的表现也有所提升
feature neutralization: 把最后target按140多个feature进行neutralization,这个力度太大的话会显著增加corr sharpe,但是有损mean corr,我把proportion设成0.5,效果很好

因为刚做这个不到两个月,所以还有很多可以尝试的,接下来准备尝试换loss function尝试,还有将era按表现分组进行训练

这是我现在模型的表现…离做的好还是有很大的距离,signal也在做,现在表现不是非常好,只有120%APR…做这个真的有些时候挺费时的,希望使用中文的朋友一起分享自己的提高方法,我们一起提高模型表现!

autratec · August 9, 2021, 4:03am

感谢分享。

数据分析不是我的专业，所以在建模上，还是严重依赖我所使用的工具 - Azure Machine Learning studio.

有使用 feature filter 的功能，选择了150个参数。也使用了 Hyper Parameter 对树模型进行优化。还没有找到使用 Azure ML studio 做参数中和的自动化的模块链接。

每次递交validation的结果，大多是黑色，或者红色。还没看到过绿色。

在 signal 方面，好像结果比 tournament 要好。由于我做外汇交易，所以选取了在外汇交易终端有数据的 300多个股票。可以直接利用终端的指数建模。现在每周提交的 APR 很高。但实际交易结果则有上有下。还需要观察。

xiafanaina · August 9, 2021, 4:56am

请问一下signal建模你都用哪些feature呢?我自己现在只用了rsi,macd和sma作为输入,有什么别的指数或者signal可以参考么?

autratec · August 9, 2021, 5:08am

我使用了Oscillator 指标, 在多个时间空间维度上采集数据建模。APR 有 700+. 感觉 overfit .

yxbot · August 23, 2021, 10:36pm

谢谢大家的分享，我这里分享一下我的validation的方法。主要的idea是尽量利用validation1和validation2 之间的ratio，同时侧重考虑val2的corr和sharpe. 以下这图是我参考的metrics

我发现如果光是一 val_corr或val_sharpe来做参考值的话，有时会出现val1 corr很高，而val2很低的情况. 考虑到val2来源于train+val1后好几年的数据，直觉就是val2 corr 和sharpe相当要靠谱一些。另外就是尽量找va1/val2 corr ratio 或这va1/val2 sharpe ratio比较低的，也就是说重点找一些能稳定预测n年后数据的模型。

在此之上，再加上live rounds上的表现来进一步评估。目前发现我的模型在live rounds上的表现和以上的表格还算吻合，有几个比较不符合这个规律的，还有待进一步观察。

总之，我的特征选取和目模型参数目前都是按这个方式做。没怎么做特征工程，可能有时间会补一下。