【中文】使用中文的朋友,一起聊聊

Chinese Content:

新开一个帖子。让使用中文的朋友一起聊聊 NUMERAI 以及 SIGNAL. 互相协助,共同进步。

3 Likes

大陆现在严管影响你们资金进出和参与竞赛么?

哈哈。找到一个使用中文的朋友了。 我在新加坡。

1 Like

来了,正在入门中,这个能真金白银的干吗?出入金怎么搞啊

Chinese content:

从现在的系统表现看, 好像可以真金白银的干。NMR 可以出金到个人的钱包。 如何到个人的银行账户,就看自己的造化了。 不过还没点到点试过。

1 Like

可以,准备开搞,这个有 对接 实时(美股)股票市场 还是虚拟币?

emmmm 放弃了,不准备搞了,我还是回去A股量化吧,这个还要注册用AWS

chinese content.

可以先从 Tournament 开始。市场数据已经准备了。 只需要自己搞一个后台的计算模型,每周发送预测就可以。 我用 AZURE ML STUDIO (free) 就可以了。 至于 SIGNAL 讯号, 可以慢慢来。 这个对全程的数据处理,要求会高一点。

给力啊,终于有中文的了.同志们互相分享一起起飞啊

Chinese

有什么问题,可以讨论一下。

潜水的,冒个泡。
祝各位NMR财源广进 :grinning:

1 Like

Chinese 希望以太币和 NMR 的价格 能稳住。不要太低或太高。

歡迎你們😬 我是Numerai的CTO. 重香港長大但中文不太好。請多多指教。

有什麼我能幫忙或解釋的地方可以直接問我 :fox_face:

3 Likes

感谢回复。接触 numerai 几周时间,但从各位的零零碎碎的回复中,学到很多东西。也感谢论坛一路来的支持。

1 Like

老kaggle发烧友, 从2016/2017年开始关注Numerai, 20+个features的时候玩过一段时间后就断了几年回去kaggle上继续比赛了。不过这几年一直有关注Numerai的进展,觉得skin in the game是个非常有革命性的概念。

去年好朋友看玩得很好,很是羡慕 - 所以今年几个月前我自己有开始入坑了。 现在从数据上,比赛的形式上,社区的建设上, 觉得都做得很好。 和几年前比觉得是进步真是很大的。

以后会继续积极参与 :smiley: :rocket:

2 Likes

请问大家有什么好的方法提高模型表现么?我先分享一下我做的:

  1. 用optuna来进行超参数调参,这个对模型表现提升很大
  2. 把feature的value distribution分类(大概有14个distribution),然后每个distribution都加入random noise,通过MDI,和SHAP来做feature selection.筛选完最后只用了140多个feature,模型的表现也有所提升
  3. feature neutralization: 把最后target按140多个feature进行neutralization,这个力度太大的话会显著增加corr sharpe,但是有损mean corr,我把proportion设成0.5,效果很好

因为刚做这个不到两个月,所以还有很多可以尝试的,接下来准备尝试换loss function尝试,还有将era按表现分组进行训练

image

这是我现在模型的表现…离做的好还是有很大的距离,signal也在做,现在表现不是非常好,只有120%APR…做这个真的有些时候挺费时的,希望使用中文的朋友一起分享自己的提高方法,我们一起提高模型表现!

1 Like

感谢分享。

数据分析不是我的专业,所以在建模上,还是严重依赖我所使用的工具 - Azure Machine Learning studio.

有使用 feature filter 的功能,选择了150个参数。也使用了 Hyper Parameter 对树模型进行优化。还没有找到使用 Azure ML studio 做参数中和的自动化的模块链接。

每次递交validation的结果,大多是黑色,或者红色。还没看到过绿色。

在 signal 方面,好像结果比 tournament 要好。由于我做外汇交易,所以选取了在外汇交易终端有数据的 300多个股票。可以直接利用终端的指数建模。现在每周提交的 APR 很高。但实际交易结果则有上有下。还需要观察。

1 Like

请问一下signal建模你都用哪些feature呢?我自己现在只用了rsi,macd和sma作为输入,有什么别的指数或者signal可以参考么?

我使用了Oscillator 指标, 在多个时间空间维度上采集数据建模。APR 有 700+. 感觉 overfit .

谢谢大家的分享, 我这里分享一下我的validation的方法。主要的idea是尽量利用validation1和validation2 之间的ratio,同时侧重考虑val2的corr和sharpe. 以下这图是我参考的metrics

我发现如果光是一 val_corr或val_sharpe来做参考值的话,有时会出现val1 corr很高,而val2很低的情况. 考虑到val2来源于train+val1后好几年的数据, 直觉就是val2 corr 和sharpe相当要靠谱一些。 另外就是尽量找va1/val2 corr ratio 或这va1/val2 sharpe ratio比较低的, 也就是说重点找一些能稳定预测n年后数据的模型。

在此之上, 再加上live rounds上的表现来进一步评估。 目前发现我的模型在live rounds上的表现和以上的表格还算吻合, 有几个比较不符合这个规律的,还有待进一步观察。

总之, 我的特征选取和目模型参数目前都是按这个方式做。 没怎么做特征工程,可能有时间会补一下。

1 Like