В нашей библиотеке: 321 книг 226 авторов 0 статей За всё время нас посетило 915309 человек которые просмотрели 18053214 страниц.
Читатели оставили 10 отзывов о писателях, 70 отзывов о книгах и 6 о сайте


Название: Энциклопедия торговых стратегий

Автор: Джеффри Оуэн Кац

Жанр: Технический анализ

Рейтинг:

Просмотров: 1869

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 |




Статистическая   оценка   системы

 

Разобравшись с некоторыми основными положениями, рассмотрим при- менение  статистики  при разработке и оценке торговых систем. Приме- ры, приведенные  ниже, основаны на системе, которая была оптимизи- рована  на некоторой выборке данных  и затем тестировалась вне преде- лов выборки.  Оценка  на данных вне пределов выборки  будет рассмот- рена перед оценкой  на основе  выборки,  поскольку ее статистический анализ  проще  (и аналогичен анализу  неоптимизированной системы), в

76        ЧАСТЬ I   РАБОЧИЕ ИНСТРУМЕНТЫ

 

нем не требуются поправки  на оптимизацию  или множественные  тес- ты. Система представляет собой модель торговли индексом  S&P 500, ос- нованную  на лунном  цикле,  и была опубликована  нами ранее  (K atz, M cC orm ick, июнь 1997). Код для системы в формате TradeStation приве- ден ниже:

 

DefineDLLFunc:"SCSIWA.DLL",LONG,"SA_MoonPhaseDate",LONG,LONG; Inputs: Ll(0);

Vars: FullMoonDate(O) , NewMoonDate(0) , Trend(O);

 

{ Функция возвращает дату следующей полной или новой луны ) FullMoonDate = SA_MoonPhaseDate (Date[5], 2);

NewMoonDate = SA_MoonPhaseDate (Date[5], 0) ;

 

Value1 = 0;

If (Date < FullMoonDate)  And (Date Tomorrow >= FullMoonDate) Then Valuel  = 1; (Полная  луна сегодня  вечером  или завтра)

Value2 = 0;

If (Date < NewMoonDate) And (Date Tomorrow >= NewMoonDate) Then Value2 = 1; {Новая луна сегодня вечером или завтра]

 

If Valuel[L1] > 0 Then Buy At Market; If Value2[L1] > 0 Then Sell At Market;

 

Пример  1: Оценка теста  вне пределов выборки

 

Оценка оптимизированной системы на данных,  взятых вне пределов вы- борки  и ни разу не использованных при оптимизации, аналогична оцен- ке неоптимизированной системы. В обоих случаях проводится один тест без подстройки параметров. В табл. 4-1 показано применение статистики для  оценки неоптимизированной  системы. Там  приведены результаты проверки на данных  вне пределов выборки совместно с рядом  статисти- ческих показателей. Помните,  что в этом тесте использованы  «свежие данные», которые не применялись как основа для настройки параметров системы.

Параметры  торговой модели уже были определены.  Образец данных

для оценки  вне пределов выборки  охватывает период с 1.01.1995 г. по

1.01.1997 г.; модель тестировалась на этих данных и совершала смодели- рованные  сделки. Было проведено  47 сделок.  Этот набор сделок можно считать выборкой  сделок,  т.е. частью популяции  смоделированных  сде- лок, которые система совершила бы по данным правилам в прошлом или будущем. Здесь возникает вопрос по поводу оценки  показателя  средней прибыли в сделке — могло  ли данное  значение быть достигнуто за счет чистой случайности? Чтобы найти ответ, потребуется статистическая оценка системы.

Чтобы начать оценку системы, для начала нужно рассчитать среднее

в выборке для n сделок.  Среднее  здесь будет просто  суммой прибылей/

убытков,  поделенной на n (в данном случае 47). Среднее составило $974,47

ГЛАВА  4   СТАТИСТИКА 77

 

Таблица  4—1.    Сделки  вне выборки  данных S &P 500,  использованные  для тестирования  модели  на лунном  цикле

 

Дата входа

950207

Дата выхода

950221

Прибыль/

убыток

650

Капитал

 

88825

Статистический  анализ средн

ей прибыли/ убытка

950221

950223

-2500

86325

Размер  выборки

47.0000

950309

950323

6025

92350

Среднее значение выборки

974.4681

950323

950324

-2500

89850

Стандартное отклонение выб

орки             6091.1029

950407

950419

-2500

87350

Ожидаемое СО среднего

888.4787

950421

950424

-2500

84850

 

 

950509

950518

-2500

82350

Т-критерий (P/ L>0)

1.0968

950523

950524

-2500

79850

Вероятность (значимость)

0.1392

950606

950609

-2500

77350

 

 

950620

950622

-2500

74850

Автокорреляция,  сдвиг=1

0.2120

950704

950719

4400

79250

Т-критерий

1.4391

950719

950725

-2500

76750

Вероятность (значимость)

0.1572

950803

950818

2575

79325

 

 

950818

950901

25

79350

Прибыльных сделок

16.0000

950901

950918

10475

89825

Процент прибыльных сделок

0.3404

950918

950929

-2500

87325

Верхняя 99%-ная граница

0.5319

951002

951003

-2500

84825

Нижняя 99%-ная граница

0.1702

951017

951018

-2550

82275

 

 

951031

951114

3150

85425

 

 

951114

951116

-2500

82925

 

 

951129

951214

6750

89675

 

 

951214

951228

5250

94925

 

 

951228

960109

-2500

92425

 

 

960112

960117

-2500

89925

 

 

960129

960213

18700

108625

 

 

960213

960213

-2500

106125

 

 

960227

960227

-2500

103625

 

 

 

 

за сделку. Стандартное отклонение (изменчивость показателей прибылей/ убытков)  рассчитывается после этого вычитанием среднего  из каждого результата,  что дает 47 (n) отклонений. Каждое  из значений отклонения возводится в квадрат,   все  квадраты складываются,  сумма  квадратов де- лится  на n — 1 (в данном случае 46), квадратный корень  от результата  и будет стандартным отклонением выборки. На основе  стандартного от- клонения выборки вычисляется ожидаемое стандартное отклонение при- были в сделке: стандартное отклонение (в данном случае $6091,10)  делит- ся на квадратный корень  из n. В нашем  случае  ожидаемое стандартное отклонение  составляет $888,48.

Чтобы  определить вероятность случайного происхождения наблюда-

емой  прибыли, проводится простая проверка по критерию Стьюдента. Поскольку прибыльность выборки сравнивается с нулевой  прибыльнос- тью,  из среднего, вычисленного выше,  вычитается ноль,  и результат  де- лится  на стандартное отклонение выборки для получения значения кри- терия t , в данном случае— 1,0968.  В конце  концов оценивается вероят- ность получения столь большого t по чистой  случайности. Для этого рас-

7 8       ЧАСТЬ  I    РАБОЧИЕ ИНСТРУМЕНТЫ

 

 

Рисунок 4-1.  функция и плотность распределения вероятностей для сделок  в пределах выборки.

 

считывается функция  распределения  t для данных  показателей с количе- ством степеней свободы,  равным n— 1 (или 46).

Программа работы  с таблицами M icrosoft Excel имеет  функцию вы- числения вероятностей на основе t-распределения. В сборнике «N umerical Recipes in С» приведены неполные бета-функции,  при  помощи которых очень легко рассчитывать вероятности, основанные на различных крите- риях  распределения, включая критерий Стьюдента. Функция распреде- ления  Стьюдента дает показатели вероятности случайного происхожде- ния результатов системы. Поскольку в данном случае этот показатель был мал,  вряд ли причиной эффективности системы была подгонка под слу- чайные  характеристики выборки. Чем меньше этот показатель, тем мень- ше  вероятность того,  что эффективность  системы обусловлена случаем. В данном случае показатель был равен 0,1392, т.е. при испытании на неза- висимых данных  неэффективная система показала бы столь же высокую, как и в тесте, прибыль только в 14% случаев.

Хотя проверка по критерию Стьюдента в этом случае рассчитывалась для прибылей/ убытков,  она могла быть с равным успехом применена, на- пример, к выборке дневных прибылей. Дневные прибыли именно так ис-

ГЛАВА  4    СТАТИСТИКА                                                                                                                                                          79

 

пользовались в тестах, описанных в последующих главах. Фактически, со- отношение риска/ прибыли, выраженное в процентах годовых,  упомина- емое  во  многих  таблицах и примерах представляет собой  t-статистику дневных прибылей.

Кроме того,  оценивался доверительный  интервал  вероятности выиг- рышной сделки. К примеру, из 47 сделок  было  16 выигрышей, т.е. про- цент прибыльных сделок был равен 0,3404. При помощи особой обратной функции биноминального распределения мы рассчитали верхний и ниж- ний 99%-ные пределы. Вероятность того, что процент прибыльных сделок системы в целом  составит от 0,1702 до 0,5319 составляет 99%. В E xcel для вычисления доверительных интервалов можно использовать функцию CRITBIN OM .

Различные статистические показатели и вероятности, описанные выше,  должны предоставить разработчику системы важную информацию о поведении торговой модели  в случае,  если  соответствуют реальности предположения о нормальном распределении и независимости данных  в выборке. Впрочем, чаще всего заключения, основанные на проверке по критерию Стьюдента и других  статистических показателях, нарушают- ся; рыночные данные заметно отклоняются от нормального распределе- ния,  и сделки оказываются зависимыми друг от друга. Кроме того, выбор- ка данных  может  быть непредставительной. Означает ли это,  что все вы- шеописанное не имеет смысла? Рассмотрим примеры.

 

Что,  если распределение не соответствует нормальному? При про- ведении проверки по критерию Стьюдента исходят  из предположения, что данные соответствуют нормальному распределению.  В реальности распределение показателей прибылей и убытков торговой системы таким не бывает,  особенно при наличии защитных остановок и целевых прибы- лей, как показано на рис. 4-1. Дело в том, что прибыль выше,  чем целевая, возникает редко.   Фактически большинство прибыльных сделок  будут иметь прибыль, близкую к целевой. С другой стороны, кое-какие сделки закроются с убытком, соответствующим уровню  защитной остановки, а между ними  будут разбросаны другие сделки, с прибылью, зависящей от методики выхода.  Следовательно, это будет совсем  непохоже на колоко- лообразную кривую, которая описывает нормальное распределение. Это составляет нарушение правил, лежащих в основе проверки по критерию Стьюдента. Впрочем, в данном случае спасает  так называемая централь- ная предельная теорема: с ростом  числа точек данных  в выборке распре- деление стремится к нормальному. Если размер  выборки составит 10, то ошибки будут небольшими; если же их будет 20 —30, ошибки будут иметь исчезающе малое значение для статистических заключений. Следователь- но, многие виды статистического анализа можно с уверенностью приме- нять при адекватном размере выборки, например при n =  47 и выше,  не опасаясь за достоверность заключений.

80                                                                                                  ЧАСТЬ  I   РАБОЧИЕ ИНСТРУМЕНТЫ

 

Что,   если  существует  серийная зависимость? Более серьезным на- рушением, способным сделать  неправомочным вышеописанное приме- нение проверки по критерию Стьюдента, является серийная зависи- мость — случай,  когда данные в выборке не являются независимыми друг от друга.  Сделки совершаются в  виде  временного  ряда.  Последователь- ность сделок,  совершенных в течение некоторого периода времени, нельзя назвать случайной выборкой —подлинно случайная выборка состояла бы, например, из 100 сделок,  выбранных случайным образом из всей популя- ции данных — от начала рынка (например, 1983 г. для S&P 500) до отдален- ного  будущего.  Такая  выборка не только  была бы защищена от серийной зависимости, но и являлась бы более  представительной для популяции. Однако при  разработке торговых систем  выборка сделок  обычно произ- водится на ограниченном временном отрезке; следовательно, может  на- блюдаться корреляция каждой сделки  с соседними, что сделает  данные зависимыми.

Практический эффект этого явления состоит в уменьшении размеров выборки. Если между данными существует серийная зависимость, то, де- лая статистические выводы, следует считать,  что выборка в два или в че- тыре раза меньше реального количества точек данных.  Вдобавок опреде- лить достоверным образом степень зависимости данных  невозможно, можно только  сделать  грубую  оценку — например,  рассчитав серийную корреляцию точки данных  с предшествующей и предыдущей точками. Рассчитывается корреляция прибыли/ убытка  сделки  i и прибыли/ убыт- ка сделок  i +  1 и i — 1. В данном случае серийная корреляция составила

0, 2120. Это немного, но предпочтительным было  бы меньшее значение. Можно также рассчитать связанный t-критерий для статистической зна- чимости значения корреляции. В данном случае  выясняется, что если бы в популяции действительно не было серьезной зависимости, то такой уровень  корреляции наблюдался бы только  в 16% тестов.

Серийная зависимость —серьезная проблема. Если она высока, то для

борьбы  с ней надо считать выборку меньшей, чем она есть на самом деле. Другой вариант — выбрать случайным образом данные для тестирования из различных участков за длительный период  времени. Это также  повы- сит представительность выборки в отношении всей популяции.

 

Что, если изменится рынок? При разработке торговых систем возможно нарушение третьего  положения t-критерия, и его невозможно предуга- дать или компенсировать. Причина этого  нарушения в том,  что популя- ция,  из которой взят образец данных  для тестирования или разработки, может отличаться от популяции, данные из которой будут использовать- ся в будущих сделках.  Рынок может подвергаться структурным или иным изменениям. Как говорилось, популяция данных S&P 500 до 1983 г. прин- ципиально отличается от последующих данных,  когда началась торговля опционами и фьючерсами. Подобные события могут разрушить любой

ГЛАВА 4   СТАТИСТИКА                                                                                                                                                      81

 

метод оценки системы. Как  бы ни проводилось тестирование, при изме- нении рынка  до начала  реальной торговли окажется, что система  разра- батывалась и тестировалась на одном  рынке,   а работать  будет на другом. Естественно, модель  разваливается на части.  Даже самая  лучшая  модель будет уничтожена изменением  рынка.

Тем не менее большинство рынков постоянно  меняются. Несмотря на

этот суровый  факт,  использование статистики в оценке системы остается принципиально важным, поскольку если рынок не изменится вскоре после начала работы системы или же изменения рынка недостаточны, чтобы ока- зать глубокое  влияние, то статистически возможно произвести достаточно достоверную оценку ожидаемых вероятностей  и прибылей  системы.

 

Пример 2: Оценка  тестов  на данных в пределах выборки

 

Каким образом можно  оценивать систему,  которая подвергалась подгон- ке параметров (т.е. оптимизации) по некоторой выборке данных?  Трей- деры часто оптимизируют системы для улучшения результатов. В данном аспекте применение статистики особенно важно, поскольку позволяет анализировать результаты,   компенсируя этим  большое  количество тес- товых прогонов во время оптимизации. В табл. 4-2 приведены показатели прибыли/ убытка и различные  статистические  показатели  для тестов в пределах выборки  (т.е. на данных,  использовавшихся  для оптимизации системы).  Система  подвергалась оптимизации  на данных  за период  с

1.01.1990г. по 1.02.1995г.

Большая часть статистики в табл. 4-2 идентична показателями табл. 4-1 из примера 1. Добавлены два дополнительных показателя — «Количество тестов оптимизации» и «Скорректировано по оптимизации». Первый по- казатель  — просто  количество различных комбинаций  параметров, т.е. число  испытаний системы по выборке данных  с различными параметра- ми. Поскольку первый параметр системы на лунном  цикле,  L1, принимал значения от 1 до 20 с шагом в 1, было проведено 20 тестов и соответствен- но получено 20 значений t-критерия.

Количество тестов,  использованных для коррекции вероятности (зна- чимости) по лучшему  показателю t-критерия,  определяется следующим образом: от 1 отнимается статистическая значимость лучшего теста,  ре- зультат  возводится в степень  m  (где т— число  прогонок тестов).  Затем этот результат  вычитается из  единицы. Это  показывает вероятность об- наружения в т тестах (в данном случае т =  20) по крайней мере одного значения t-критерия, как минимум не уступающего действительно обна- руженному в данном решении. Некорректированная вероятность случай- ного  происхождения результатов составляет менее  2% — весьма  впечат- ляющий показатель.  После коррекции  по множественным  тестам (опти- мизации)  картина в корне меняется. Результаты с такой прибыльностью

82        ЧАСТЬ I   РАБОЧИЕ ИНСТРУМЕНТЫ

 

Таблица 4—2.   Сделки  на выборке данных S &P 500,  использованной для тести- рования  модели на лунном  цикле

 

Дата                Дата    Прибыль/        Капитал          Статистический анализ  средней прибыли/ убытка входа            выхода               убыток

900417            900501            5750    5750

900501            900516            11700 17450  Размер выборки         118.0000

900516            900522            -2500   14950 Среднее значение выборки 740.9664

900531            900615            150      15100 Стандартное  отклонение  выборки            3811.3550

900615            900702            2300    17400 Ожидаемое СО среднего      350.8637

900702            900716            4550    21950

900716

900731

6675

28625

Т-критерий (P/ L>0)

2.1118

900731

900802

-2500

26125

Вероятность (значимость)

0.0184

900814

900828

9500

35625

Количество тестов оптимизации

20.0000

900828

900911

575

36200

Скорректировано по оптимизации

0.3104

900911

900926

7225

43425

 

 

900926

900926

-2500

40925

Корреляция серии  (отставание=1)

0.0479

901010

901019

-2875

38050

Связанный  t-критерий

0.5139

901026

901029

-2500

35550

Вероятность (значимость)

0.6083

901109

901112

-2700

32850

 

 

901126

901211

8125

40975

Прибыльных  сделок

58.0000

901211

901225

-875

40100

Процент  прибыльных  сделок

0.4915

901225

910102

-2500

37600

Верхняя 99%-ная  граница

0.6102

910108

910109

-2500

35100

Нижняя 99%-ная  граница

0.3729

910122

910206

9850

44950

(Границы  не скорректированы по оптимизации)

910206

910206

-2500

42450

 

910221

910308

4550

47000

 

910308

910322

5250

52250

 

910322

910409

5600

57850

 

910409

910416

-2500

55350

 

910423

910425

-2500

52850

 

910507

910521

3800

56650

 

 

 

системы могли быть достигнуты чисто случайно в 31% случаев! Впрочем, все не так плохо.  Настройка была крайне консервативной и исходила  из полной независимости тестов друг от друга. На самом  же деле между тес- тами  будет идти  значительная серийная корреляция,  поскольку в боль- шинстве традиционных систем  небольшие изменения параметров вызы- вают небольшие изменения результатов. Это в точности напоминает се- рийную  зависимость в выборках данных:  эффективный размер  снижает- ся,  если  снижается эффективное количество проведенных тестов.  По- скольку  многие  из тестов  коррелируют друг с другом,  20 проведенных соответствуют 5—10 «реальным» независимым тестам.  Учитывая серий- ную зависимость между тестами,  вероятность с поправкой на оптимиза- цию составит около 0,15, а не 0,3104. Поскольку природа и точная  величи- на серийной зависимости тестов неизвестны, менее  консервативное зак- лючение об оптимизации не может быть рассчитано напрямую, а только может быть примерно оценено.

В некоторых случаях,  например в моделях множественной регрессии, существуют точные математические формулы для  расчета статистичес-

ГЛАВА  4   СТАТИСТИКА                                                                                                                                                        83

 

ких параметров с учетом процесса подгонки  (оптимизации),  что делает излишними поправки на оптимизацию.

 

Трактовка статистических показателей

 

В примере 1 представлен тест с проверкой системы, в примере 2 — опти- мизация на данных из выборки. При обсуждении результатов мы возвра- щаемся к естественному порядку проведения тестов, т.е. сначала оптими- зация, а потом проверка.

 

Результаты  оптимизации. В табл.  4-2 показаны результаты  анализа данных из выборки.  За 5 лет периода оптимизации  система провела 118 сделок (n =  118), средняя сделка дала прибыль в $740,97, и сделки были весьма различными:  стандартное  отклонение  выборки  составило  около

$3811. Таким образом, во многих сделках убытки составляли тысячи дол-

ларов, в других такого же масштаба достигали прибыли. Степень прибыль- ности  легко  оценить  по столбцу  «Прибыль/ Убыток»,  в котором  встреча-

ется немало убытков в $2500 (на этом уровне активировалась защитная остановка) и значительное количество прибылей, многие  более  $5000,  а некоторые даже более $10 000. Ожидаемое стандартное отклонение  сред- ней прибыли в сделке показывает, что если бы такие расчеты  многократ- но проводились на схожих выборках,  то среднее  колебалось бы в преде- лах десяти  процентов, и многие  выборки показывали бы среднюю  при- быльность в размере  $740 ±  350.

Т-критерий для  наилучшего решения составил  2, 1118 при  статисти- ческой  значимости 0,0184. Это весьма впечатляющий результат.  Если  бы тест проводился только один раз (без оптимизации),  то вероятность слу- чайно  достичь такого  значения была бы около  2%


Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 |

Оцените книгу: 1 2 3 4 5

Добавление комментария:






Информацию в электронную библиотеку yourforexschool.com добавляют исключительно для ознакомления. Если вы являетесь автором книги или компанией которая имеет права распространения и вы хотите чтоб на сайте не было вашей книги, то напишите в обратную связь и мы незамедлительно удалим её.

Копирование материалов сайта разрешено только с использованием активной ссылки на yourforexschool.com Copyright © 2010