数据:

  1. 时间戳,价格数据

    'Open timestamp', 'Open', 'High', 'Low', 'Close', 'Volume',

  2. 成交量数据

    'Taker Buy Quote Asset Volume', 'Taker Buy Base Asset Volume', 'Quote Asset Volume', 'Number of trades', 'Taker Sell Base Asset Amount', 'Mid Price', 'Taker Buy Amount', 'Taker Sell Amount', 'Quote Asset Amount', 'Taker Buy Base Asset Amount'

    建议只看Amount, volume与trade是原始数据,排序信息量不大

    价格数据与amount可以拿来构建一些因子,但作为原始输入不推荐

  3. 波动率数据 各个时间上的价格标准差

    'Close_log', 'kClose', 'ZQ30', 'ZQ60', 'ZQ120', 'ZQ240', 'ZQ480', 'ZQ960', 'ZQ1920', 'ZQ3840', 'JHB60', 'JHB240', 'JHB960', 'JHB3840', 'std-Close_log-60', 'std-Close_log-240', 'std-Close_log-960', 'std-Close_log-3840', '5min_JHB60', '5min_JHB288', '5min_JHB1008', '5minstd-Close_log-288', '5minstd-Close_log-1008', '5minstd-Close_log-60', '60min_JHB168', '60min_JHB720', '60minstd-Close_log-168', '60minstd-Close_log-720',

目前未标准化, 如果标准化可以拼接多个dataframe,基于同一时间的排序

概念:

单时间序列上:波动性越低,持有相似成本的人就越多。

市场维度上:订单会向高波动,高成交量的股票或虚拟币集中,代表着未来市场热度。

目标:

目的是能早阶段监测到波动率的提升,预测到未来一段时间窗口的波动率变化,成交量排名变化,收益率变化。如果是预测方向,希望有一个鲁棒的置信度参数。

欢迎进行以下工作

  1. 评估波动性的更好方法
  2. 模型预测,或因子指标构建
  3. 提出更稳定科学的label设计