来源:期刊VIP网所属分类:经济学发布时间:2021-05-31浏览:次
摘要:本文针对我国期货市场流动性较好的期货品种,对比分析了时间时钟(time clock)和成交量时钟(volume clock)两种行情采样方法,研究发现:相较于时间时钟采样方法,基于成交量时钟采样得到的数据序列成交量分布更均匀且肥尾效应减弱,统计特性显著改善。本文基于指数移动均线日内策略对两种采样方法的组合绩效进行了实证研究,结果表明:基于成交量时钟的组合绩效在不同交易频率下均有提高,且基于时间时钟采样的成交量波动率越大,绩效的改善就越显著,成交量时钟采样方法更适合用于较高频率的策略。
关键词:行情采样方法 成交量时钟 日内策略 高频交易
一、引言
基于量价信息的市场行情数据在二级市场的投资决策中是非常重要的一类数据输入源,特别是对于基于小时级别以下K线序列的中高频CTA策略和基于市场微观结构的高频交易策略,交易决策的依据主要是基于量价信息提取的数据特征。市场行情数据是指交易所内交易行为产生的信息流,国外发达国家的二级市场一般能够向市场参与者提供实时的高频分笔报撤单和逐笔成交回报数据(tick 数据),国内的股票和期货交易所一般仅能提供固定时间频率的行情快照数据。中低频量化交易策略大体上分为择时策略和选股策略两种类型,包括时间序列和横截面两个维度[1],无论是基于机器学习还是基于传统统计方法的中低频量化策略,非结构的原始行情数据由于存在较多的噪音不能直接用于策略的统计建模,原始tick 数据一般需要通过采样聚合等方法清洗加工成结构化的数据序列,例如K线时间序列数据。
López de Prado(2019)[2]指出合理的数据分析和管理是构建一套有效量化策略的关键环节,学界和业界最常用的数据清洗加工方法是基于自然时间时钟的数据采样方法,即按一定的时间间隔进行行情数据的采样统计,例如按年、日、小时、分钟等频率对行情数据进行采样以形成不同频率的K线数据。基于时间时钟的数据采样方法符合人的直觉且操作简单,但存在一些明显的缺点,López de Prado(2018)[3]指出传统的时间时钟采样方法主要存在两个主要问题:第一,市场中交易行为不按固定的时间频率产生,即交易信息在时间维度上的分布不均匀,这会导致基于固定时间的行情采样方法在交易活跃的时间段采样不足,在交易寡淡的时间段又会过度采样;第二,基于时间时钟采样得到的数据序列的统计特性较差,例如呈现序列自相关和异方差性,不满足正态分布和独立同分布等统计假设,这会导致建模和计算更加复杂。
近些年来,随着计算机技术的飞速发展,高频交易已经成为市场中不可忽视的一股力量,高频交易由技术和数据进行驱动,其交易信息主要是基于订单流和限价订单薄提取的市场微观结构,其交易类型包括套利、做市、方向交易等[4]。高频交易的收益主要来源于对市场微观结构中的信息识别,故其对数据的精细化处理和执行速度的要求都异常苛刻,Easley等(2012)[5]指出高频交易和中低频量化交易之间除了广为人知的速度差别外,更重要的是信息处理模式的进化。中低频策略一般是在时间时钟的数据基础上统计建模,而高频交易是基于事件(event-based)来处理信息,市场微观结构的基本信息单元显然不是按时间间隔等距分布,基于事件的数据处理方法更合乎逻辑[6]。基于成交量时钟(volume clock)的数据处理方式就是一种典型的基于事件的信息处理方式,成交量时钟是用一定数量的成交量作为“计时”单位,Easley等(2012)[5]研究表明基于成交量时钟采样得到的数据序列更接近正态分布,刘睿智(2016)[7]针对国内沪深300股指期货的研究同样表明成交量时钟采样得到的收益率更接近正态分布,良好的统计特性可以大幅简化策略开发流程和提高策略执行的速度。高频交易中知情交易者的逆向选择有可能导致高频做市商产生亏损,为了衡量高频做市商面临的这种订单流毒性(Order Flow Toxicity)的大小,Easley等(2011)[8]提出了一种衡量订单流毒性大小的指标——基于成交量的知情交易概率(Volume-Synchronized Probability of Informed Trading,VPIN),其原理是以成交量时钟做高频数据统计的 “计时”工具,对交易的买卖量不平衡进行量化,进而计算得到订单流毒性。另外,刘文文和张合金(2013)[9]针对我国沪深300股指期货的研究也发现VPIN指标可以很好地监测市场大幅波动时的指令流毒性,基于成交量时钟的VPIN指标不仅可以被高频做市商用作风险管理工具,也可以被中低频交易者和监管机构用来做极端风险的警示。此外,Easley等(2012)[10]提出了基于成交量时钟的整体交易分类方法(Bulk Volume Classification,BVC),主要是来估计主动买单和主动卖单的百分比,具体方法是在以成交量时钟采样得到的数据单元内,根据数据单元的起点和终点的价格变化来计算买卖交易量的百分比,Easley(2016)[11]和Panayides(2019)[12]进一步研究表明BVC方法可以更好地分辨市场数据中的交易意图。总而言之,成交量时钟在高频交易中的诸多应用表明基于事件的信息处理模式能够更有效地获取市场中的有用信息。
本文的研究目的是探索基于成交量时钟的信息处理模式在中高频CTA策略中的应用前景,本文余下的内容:针对国内期货市场流动性较好的34个期货品种,对比分析成交量时钟和时间时钟两种采样方法的统计特性,进一步研究两种采样方法对典型CTA日内策略绩效的影响。为表述简便,后文将时间时钟和成交量时钟分别简述為“time clock”和“volume clock”,将基于成交量时钟采样得到的K线序列和基于成交量时钟采样得到的K线序列分别简述为“time-bars”和“volume-bars”。
二、研究对象和方法
(一)研究对象
本文选取国内期货市场流动性较好的34个品种作为研究对象,所选取的期货品种覆盖国内的四个期货交易所:中国金融期货交易所、上海期货交易所、大连商品交易所、郑州商品交易所,具体的期货品种参见表1。本文研究的期货行情原始tick数据源来自中泰证券(上海)资产管理有限公司的行情收录数据库,本文研究中的数据采样和统计、日内策略绩效统计分析的时间区间为2015年5月4日至2020年 4月3日,测试的数据为各期货品种的主力连续合约,数据在换月节点做差值前复权处理以消除换月产生的跳空缺口。
(二)行情采样方法
针对原始tick数据,分别基于自然时间时钟(time clock)和成交量时钟(volume clock)两种方法对一分钟频率的数据进行采样。
1.time clock行情采样方法。基于time clock的采样方法是以固定的交易时间间隔做行情数据的采样统计,生成的K线序列time-bars。本文针对特定的交易品种,按各个期货品种的实盘交易时段,在每个交易日的交易时段内每间隔1分钟对行情进行一次采样统计,由1分钟采样时段内的tick数据统计数据得到该1分钟K线的开盘价、最高价、最低价、收盘价、成交量(K线内的累积成交量)、持仓量(K线结束时刻的持仓量)等信息。
2.volume clock行情采样方法。基于volume clock的行情采样方法则是以固定的成交量间隔做行情数据的采样统计,生成的K线序列volume-bars。本文为方便对比分析两种采样方法产生K线序列的统计特性,在生成volume-bars的过程中保证每个交易日的volume-bars数量和time-bars数量相同。volume clock以固定成交量作为“计时器”,其计算如式(1)所示:
(1)
其中,是期货品种j在交易日i内的总成交量,是交易日i內1分钟频率time-bars的总数量,计算得到的是期货品种j在交易日i内用volume clock采样的成交量计数基准。
三、time-clock和 volume-clock采样方法的统计分析
针对国内的34个期货品种,具体对比分析time clock和volume clock两种采样方法对行情采样结果统计特性的影响,本文主要分析成交量波动率、价格变动和真实波幅这三个指标。
(一)成交量波动率
本文用采样方法得到的time-bars和volume-bars的成交量分布的波动率来表征成交量分布的均匀性,其中单个期货品种的成交量波动率定义如下:
(2)
其中,和分别表示第i个交易volume分布的标准差和均值,N为交易日的总天数。
图1给出了不同品种在两种采样方法下的成交量波动率对比,可以看到,相比于传统的time clock方法,volume clock采样得到的成交量分布对于所有品种都有显著的下降,即volume clock采样方法使得成交量数据序列的分布更均匀。
(二)价格变动
本文用相邻两根K线收盘价变化的相对值来表征价格变动(Price Change,PC),具体如下式所示:
(3)
其中,表示时刻K线的收盘价,表示前一根K线的收盘价,本文主要考虑行情采样方法对中高频策略的影响,在计算相应指标时仅考虑日内波动不计入隔日跳空,故针对每个交易日的第一根K线,用开盘价代替,且针对每个交易日的价格变动指标用该交易日内PC的均值和标准差做z-sore标准化。
本文用超额峰度来衡量不同期货品种的价格变动PC的超额峰度(),的定义如式(4)所示。
(4)
由图2可知,相较于time-bars,volume-bars价格变动指标的超额峰度显著减小,表明volume采样方法可以降低价格变动分布的肥尾效应,价格变动的分布更接近正态分布,统计特性更好,有利于基于K线收盘价统计建模的策略。
(三)真实波幅
本文用真实波幅(True Range,TR)来衡量行情的波动,真实波幅用当前K线的最高、最低价,以及前一根K线的收盘价进行计算,具体如下所示:
(5)
其中,、分别代表时刻K线的最高价和最低价,为上一根K线的收盘价,针对每个交易日第一根K线的处理和PC指标的计算一致,用开盘价代替,即不计入隔日跳空对TR的影响,仅考虑采样方法对日内连续行情的影响。和PC指标类似,在每个交易日对指标TR做z-score标准化。
本文用真实波幅的超额峰度来衡量不同行情采样方法下日内行情波动的肥尾程度,定义如下:
(6)
针对time-bars和volume-bars,不同期货品种的对比如图3所示。从图中可以看到,volume clock采样方法下的显著低于time clock方法,表明volume采样方法得到的价格波动率分布的肥尾效应也显著降低,TR分布更接近正态分布。TR代表K线的长度,衡量了单根K线的平均波动幅度,TR异常离群值的减少可以提高策略对行情剧烈变动的适应性。
四、关于日内策略的实证检验和分析
上文的统计分析表明:针对1分钟频率的数据,volume clock采样得到的行情统计特性显著优于传统time clock方法,K线收盘价分布和真实波幅分布的肥尾效应都显著降低,采样数据上的异常离群值减少,分布相对更集中,交易信息的密度。下文进一步实证分析不同行情采样方法对典型日内策略的绩效影响,为保证研究的实用价值,在评价策略绩效的过程中应避免使用未来数据,故后文在应用volume clock进行行情采样的过程中,用历史交易日成交量的指数加权平均值作为当日总成交量的估计值,的计算如下:
(7)
其中,为第i日的成交量,为计算指数加权系数α的周期数,本文设置为5,即用5日指数加权平均的日成交量作为i+1日总成交量的估计值,行情采样的其他步骤和上文一致。
(一)日内策略的逻辑
本文采用简单的指数移动双均线构造日内策略,迭代计算指数移动双均线中的短期均线和长期均线,具体算法如(8)式和(9)式所示。
其中,和分别代表短期均线和长期均线的指数加权均值,和分别代表计算短期均线和长期均线的指数加权权重系数,和分别是快线和慢线对应的时间周期。
推荐阅读:期货相关的论文文献多吗 怎么找
期刊VIP网,您身边的高端学术顾问
文章名称: 基于成交量时钟的国内期货行情采样方法研究
文章地址: http://www.qikanvip.com/jingjixue/57721.html