В нашей библиотеке: 321 книг 226 авторов 0 статей За всё время нас посетило 875319 человек которые просмотрели 17332469 страниц.
Читатели оставили 10 отзывов о писателях, 69 отзывов о книгах и 6 о сайте


Название: Энциклопедия торговых стратегий

Автор: Джеффри Оуэн Кац

Жанр: Технический анализ

Рейтинг:

Просмотров: 1769

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 |




Оптимизация  и  подгонка  под  исторические  данные

 

Еще один аспект разработки торговых систем состоит в оптимизации, т.е. улучшении эффективности систем при помощи подбора таких значений параметров,  при которых система дает наилучший  результат на выборке данных. Если система не работает при тестировании на данных вне пре- делов выборки или на реальном рынке,  говорят,  что при оптимизации имела место подгонка под исторические данные. Впрочем,  подгонка  бы- вает полезной  и вредной.  Полезная подгонка — это случай, когда модель подогнана под всю популяцию (т.е. под достаточно большую и представи- тельную)  и при этом отражает все достоверные  характеристики  реаль- ной популяции  в системе.  Подгонка вредна, если система соответствует только некоторым случайным характеристикам,  не обязательно отража- ющим свойства всей популяции.

Разработчики недаром боятся вредной подгонки, т.е. ситуации, когда

параметры, оптимизированные на данной выборке, не работают на попу-

ГЛАВА  4   СТАТИСТИКА                                                                                                                                                        73

 

ляции в целом.  Если выборка была небольшой или не представительной, вероятнее всего,  система будет работать  хорошо  на данной выборке и из рук вон плохо на другой или,  что еще опаснее, приведет к потере  денег в реальной торговле. Чем  больше  выборка данных,  тем меньше эта опас- ность:  вероятность вредной подгонки снижается, а полезной — возраста- ет. Все рассматриваемые методы  статистики отражают это явление, даже специально предназначенные для оптимизации. Достоверно известно, что чем больше  параметров подвергается оптимизации,  тем больше  вероят- ность того,  что высокие результаты системы будут достигнуты чисто  слу- чайным сочетанием. Если  же результаты статистического анализа удов- летворительны, и тест основывался на достаточно большой выборке дан- ных,  то вероятность случайного результата снижается,  и даже  получен- ный  при  оптимизации  множества параметров результат  вполне может быть реальным и значимым.

Некоторые возражают, что размер  не имеет значения, т.е. размер  вы- борки  и количество проведенных сделок  не имеют  ничего  общего  с рис- ком избыточной оптимизации, и что большая выборка не снимает угрозы вредной подгонки под исторические данные. Это неверно и математичес- ки,  и интуитивно. Никто не стал бы больше  доверять системе, которая провела 3 —4 сделки  за десятилетний период, чем системе, которая про- вела более тысячи достаточно прибыльных сделок.  Представьте себе мо- дель линейной регрессии, в которой прямую линию подгоняют к ряду то- чек. Если точек всего две, то вне зависимости от их положения линию все- гда можно «подогнать» идеально. Если  точек  три,  то дело усложняется. Если  же точек  действительно много,  то проблема становится еще слож- нее,  если только  расположение точек не содержит некоего реального ли- нейного распределения.

Пример с линейной регрессией показывает, что вредная подгонка за-

трудняется с ростом объема данных.  Сравните две торговые системы: одна провела 2 сделки  с прибылью $100 в каждой и стандартным отклонением

$100; другая — 1000 сделок  с такими же средним и стандартным отклоне- ниями. При  статистической оценке система, проведшая 1000 сделок,  бу- дет гораздо  «статистически значимее», чем система, проведшая 2 сделки.

В моделях  множественной линейной регрессии при увеличении ко- личества параметров регрессии (бета-весов)  по  отношению к размеру выборки увеличивается степень вредной подгонки и уменьшается досто- верность результатов модели.  Другими словами, чем выше  степень под- гонки под исторические данные, тем сложнее добиться статистической значимости. Исключением является случай,  когда повышение результа- тивности модели,  вызванное подгонкой, компенсирует потерю  значимо- сти при добавлении параметров. Оценка степени ожидаемого снижения корреляции при использовании данных вне выборки может производить- ся напрямую, исходя из объема данных  и количества параметров: корре- ляция снижается с увеличением числа параметров и увеличивается с рос-

74                                                                                                 ЧАСТЬ  I   РАБОЧИЕ ИНСТРУМЕНТЫ

 

том объема  данных.  В общем,  существуют  достоверные математические доказательства того, что вероятность вредной подгонки повышается, если количество оптимизируемых параметров велико  по отношению к объему используемой выборки данных.  Фактически, когда n (размер  выборки) стремится к бесконечности,  вероятность того,  что подгонка параметров будет непредставительной для данной популяции, стремится к нулю. Чем больше  параметров оптимизируется, тем большая требуется  выборка дан- ных. На языке  статистики это звучит так: оптимизируемые параметры используют доступные степени свободы.

Все это ведет к заключению, что чем больше  выборка, тем более веро- ятность того, что найденные параметры системы будут представительным отражением характеристик рынка  в целом.  Маленькая выборка, скорее всего,  будет непредставительной: ее кривые вряд  ли  будут соответство- вать  долговременным,  устойчивым характеристикам рынка.   Любая  мо- дель, построенная с использованием маленькой выборки, может быть эф- фективной только  по чистой  случайности. Будет ли подгонка «полезной» или  «вредной», во многом  зависит  от отражения в ней  случайных цено- вых движений или  реальных рыночных процессов, что,  в свою  очередь, зависит  от представительности выборки. Статистика полезна, поскольку позволяет принять в расчет при оценке системы степень  подгонки.

При работе с нейронными сетями  опасения относительно излишнего обучения, или генерализации, соответствуют опасениям относительно излишней подгонки под исторические данные. Если выборка достаточно объемиста и представительна, повышается вероятность отражения в най- денных  оптимальных параметрах реальных характеристик рынка,  что полезно для  реальной работы  системы. Если  же выборка мала,  модель практически гарантированно будет настроена на особенности выборки, но никак не на особенности рынка  в целом.  Для нейронных сетей успех генерализации означает то же,  что для других систем,  — устойчивость в будущем и так же сильно  зависит  от размеров выборки, использованной для обучения сети. Чем больше  выборка или чем меньше количество ве- сов связей  (т.е. параметров), тем выше вероятность удачной  генерализа- ции.  Это также  можно  доказать  математически путем  разбора  неслож- ных примеров.

Как  и в случае с регрессией, при  разработке нейронной сети можно произвести оценку  коррекции коэффициента корреляции (т.е. показате- ля, обратного генерализации). Фактически, нейронная сеть представляет собой систему уравнений множественной регрессии, хотя и нелинейных, и корреляция выходных  значений сети может рассматриваться как мно- жественный коэффициент корреляции. Множественная корреляция меж- ду выходными и целевыми значениями может быть скорректирована для прогнозирования поведения системы на данных вне выборки. Такая скор- ректированная множественная корреляция должна постоянно использо- ваться для определения того, является ли эффективность нейронной сети

ГЛАВА  4    СТАТИСТИКА                                                                                                                                                            75

 

случайной или она вызвана обнаружением реальной закономерности в ценовом  поведении  рынка.  Формула коррекции  коэффициента множе- ственной корреляции  приведена ниже:

 

R C   =   SQR T    ( 1 . 0   -    (     ( N   -    1 . 0 )    /     ( N   -    Р)     )    *    ( 1 . 0   -   R *R )     )

 

Формула приведена  в стиле языка  F OR TR AN . Здесь SORT означает квадратный  корень;  N — количество точек данных или фактов  в случае нейронной  сети; Р— количество  коэффициентов регрессии или  (в слу- чае нейронной сети) весов связей; R — некорректированную множествен- ную корреляцию;  RC — скорректированную корреляцию.  Хотя эта фор- мула строго приложима только к линейной множественной регрессии (для которой, собственно, и разрабатывалась), она неплохо  работает с нейрон- ными  сетями  и может быть использована для того, чтобы оценить, какая часть эффективности системы обусловлена «вредной» подгонкой на дан- ном  образце. Эта формула  описывает связь  между размером выборки, количеством параметров и снижением эффективности результатов. Ста- тистическая коррекция,  рассчитываемая по данной формуле, будет ис- пользована в главе о входах систем на нейронных сетях.

 




Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 |

Оцените книгу: 1 2 3 4 5

Добавление комментария:






Информацию в электронную библиотеку yourforexschool.com добавляют исключительно для ознакомления. Если вы являетесь автором книги или компанией которая имеет права распространения и вы хотите чтоб на сайте не было вашей книги, то напишите в обратную связь и мы незамедлительно удалим её.

Копирование материалов сайта разрешено только с использованием активной ссылки на yourforexschool.com Copyright © 2010