Количества переменных



Недостаток данного метода заключается в том, что при увеличении количества параметров далее на 1 повышается на порядок сложность расчетов коэффициентов функции зависимости цены от величины параметров и снижается его точность.

Следует отметить, что при использовании данного метода увеличение количества параметров даже на 1 - повышает порядок сложности расчетов коэффициентов функции зависимости цены от величины параметров и снижается его точность;

Величина V - это число степеней свободы rf-распределения. Число степеней свободы зависит от количества столбцов гистограммы эмпирических данных L и количества параметров г, описывающих теоретическую модель: v = L-l-r.

Если у вас такой игры нет, тогда никакое управление деньгами в мире не спасет вас.1 С другой стороны, если у вас есть положительное ожидание, то можно, посредством правильного управления деньгами, превратить его в функцию экспоненциального роста. Не имеет значения, насколько мало это положительное ожидание! Другими словами, не имеет значения, насколько прибыльна торговая система на основе 1 контракта. Если у вас есть система, которая выигрывает 10 долларов на контракт в одной сделке (после вычета комиссионных и проскальзывания), можно использовать методы управления капиталом таким образом, чтобы сделать ее более прибыльной, чем систему, которая показывает среднюю прибыль 1000 долларов за сделку (после вычета комиссионных и проскальзывания). Имеет значение не то, насколько прибыльна ваша система была, а то, насколько определенно можно сказать, что система покажет, по крайней мере, минимальную прибыль в будущем. Поэтому наиболее важное приготовление, которое может сделать трейдер, — это убедиться в том, что система покажет положительное математическое ожидание в будущем. Для того чтобы иметь положительное математическое ожидание в будущем, очень важно не ограничивать степени свободы вашей системы. Это достигается не только упразднением или уменьшением количества параметров, подлежащих оптимизации, но также и путем сокращения как можно большего количества правил системы. Каждый параметр, который вы добавляете, каждое правило, которое вы вносите, каждое мельчайшее изменение, которое вы делаете в системе, сокращает число степеней свободы. В идеале, вам нужно построить достаточно примитивную и простую систему, которая постоянно будет приносить небольшую прибыль почти на любом рынке. И снова важно, чтобы вы поняли, — не имеет значения, насколько прибыльна система, пока она прибыльна. Деньги, которые вы заработаете в торговле, будут заработаны посредством эффективного управления деньгами. Торговая система — это просто средство, которое дает вам положительное математическое ожидание, чтобы можно было использовать управление деньгами. Системы, которые работают (показывают, по крайней мере, минимальную прибыль) только на одном или нескольких рынках или имеют различные правила или параметры для различных рынков, вероятнее всего, не будут работать в режиме реального времени достаточно долго. Проблема большинства технически ориентированных трейдеров состоит в том, что они тратят слишком много времени и усилий на оптимизацию различных правил и значений параметров торговой системы. Это дает совершенно противоположные результаты. Вместо того, чтобы тратить силы и компьютерное время на увеличение прибылей торговой системы, направьте энергию на увеличение уровня надежности получения минимальной прибыли.

следующие правила. Во-первых, используйте маленькие (и поэтому непредставительные) выборки данных для тестирования. Во-вторых, убедитесь, что у системы много правил и параметров для оптимизации. Для любого исторического периода несложно получить отличный результат при наличии большого количества параметров в системе. Кроме того, проводите все тесты на одном образце данных. Ни в коем случае не проверяйте ваши результаты на данных, расположенных вне пределов исходной выборки. И наконец, избегайте статистических заключений. Следуя эти правилам, вы обязательно потеряете деньги, применив «оптимизированную» систему в реальной торговле.

Излишне большой набор свободных параметров или правил влияет на попытку оптимизации также, как и недостаточное количество точек данных. Когда количество элементов, подвергающихся оптимизации, повышается, пропорционально растет способность модели подгонять их под любые неоднородности тестовой выборки, а следовательно, увеличивается вклад артефактов в эффективность модели. Результат оптимизации большого количества параметров или правил будет хорошо работать на тестовых данных, но плохо на данных вне выборки и в реальной торговле.

Важно учитывать не общее количество параметров оптимизации, а отношение количества этих параметров к объему данных. Здесь также эвристически достоверна описанная выше формула для малых выборок: она показывает, как соотношение числа точек данных и параметров системы влияет на результат. При наличии избыточного количества параметров решение, полученное в результате оптимизации, будет оптимальным только для тестовой выборки данных.

В моделях множественной линейной регрессии при увеличении количества параметров регрессии (бета-весов) по отношению к размеру выборки увеличивается степень вредной подгонки и уменьшается достоверность результатов модели. Другими словами, чем выше степень подгонки под исторические данные, тем сложнее добиться статистической значимости. Исключением является случай, когда повышение результативности модели, вызванное подгонкой, компенсирует потерю значимости при добавлении параметров. Оценка степени ожидаемого снижения корреляции при использовании данных вне выборки может производиться напрямую, исходя из объема данных и количества параметров: корреляция снижается с увеличением числа параметров и увеличивается с рос-

Следующий шаг разработки нейронного прогностического устройства — реальная тренировка нескольких сетей на полученном наборе фактов. Обучают серию нейронных сетей различного размера, причем метод отбора наиболее хорошо обученной и устроенной сети не состоит, как можно было бы подумать, в проверке ее эффективности на данных вне пределов выборки. Вместо этого проводится коррекция коэффициентов корреляции (показателей прогностических способностей каждой сети), причем коэффициент коррекции зависит от размера выборки данных и количества параметров (связей между нейронами) в исследуемой сети. При этом используется то же уравнение, что и при коррекции множественных корреляций, получаемых при многовариантной регрессии (см. главу о статистике и оптимизации). Чем больше и сложнее сеть, тем сильнее будут скорректированы (в меньшую сторону) коэффициенты корреляции. Этот подход помогает оценить степень излишней подгонки системы под исходные данные. Чтобы большая сеть превзошла маленькую, она должна давать значительно больший коэффициент корреляции. Этот метод позволяет выбирать лучшие сети без обычного обращения к данным вне пределов выборки. Все сети проходят полное обучение, т.е. не делается попыток скомпенсировать снижение степеней свободы меньшим обучением сети.

Принцип оптимизации состоит в том, что вероятность устойчивых результатов повышается со снижением количества параметров модели. Учитывая в чем-то положительные результаты некоторых из тестов, возможно, имеет смысл продолжать исследования с более усложненными моделями. Как вариант можно было бы улучшить предварительную обработку данных в смысле уменьшения общего числа вводов без потери важной прогностической информации — это может сделать систему очень прибыльной. При меньшем количестве вводов в сети будет меньше связей для оценки, следовательно, подгонка под кривую — важная проблема, судя по результатам и уровням усадки, — будет представлять меньшую угрозу.

Вполне ясно, что практические соображения диктуют потребность ограничить количество наборов параметров. Разумеется, простейший способ достижения такой цели состоит в уменьшении количества параметров системы. Как правило, следует использовать простейшую фор-

factor analysis: факторный анализ. Математический метод, используемый для уменьшения количества параметров структуры с целью облегчения ее изучения. Факторный анализ суммирует информацию, содержащуюся в большом числе переменных, и сжимает ее в меньшем числе факторов, содержащих взаимосвязанные переменные. Например, при изучении группы женщин их характеристики, включающие рост, вес, хобби, профессию и интересы, могут быть просуммированы с использованием таких факторов, как размер (рост и вес) и образ жизни (сочетание хобби, профессии и интересов). В результате этой операции пять переменных сжимаются в два отдельных фактора.


После построения диаграммы или списка предположений о системе имеет смысл оценить возможность расчетов по полученной модели на основе оценки количества переменных и сложности отношений между ними. Быть может, используя диаграмму, следует провести агрегирование, т. е. замену нескольких переменных одной, отражающей приближенно воздействие на систему заменяемых переменных. Хотя понятие агрегирования и близко к понятию уменьшения степени детализации, оно не равнозначно ему: если при уменьшении степени детализации мы отбрасываем то или иное влияние, считая его несущественными, то при агрегировании это влияние приблизительно учитывается с помощью некоторой переменной, называемой агрегатом. Хотя агрегирование может сильно упростить модель, пользоваться им надо осторожно, объединяя только те переменные, воздействия которых на систему аналогичны. Естественно, что разумно выбирать максимальный уровень агрегирования, при котором еще можно ответить на вопросы, стоящие перед исследователем.

После построения диаграммы или списка предположений о системе имеет смысл оценить возможность расчетов по полученной модели с точки зрения количества переменных и сложности отношений между ними. Быть может, используя диаграмму, следует провести агрегирование, т. е. замену нескольких переменных одной, отражающей приближенно воздействие заменяемых переменны *. Понятие агрегирования близко к понятию детализации, по не равнозначно ему: если при выборе степени детализации мы отбрасываем те или шще влияния, считая их несущественными, то "при агрегировании это влияние приблизительно учитывается через некоторую переменную. Хотя агрегирование может сильно упростить модель, пользоваться им надо осторожно, объединяя только те переменные, действие которых на систему аналогично. Естественно, что разумно выбирать максимальный уровень агрегирования, при котором можно еще ответить на вопросы, стоящие перед исследователем.

Когда речь идет о таблице исходов большего количества переменных, мы имеем в виду то, что называется совместным распределением переменных. Например:

Нейронные сети с прямой связью (аналоги использованной в этой главе) включают особую форму нелинейной множественной регрессии. Сеть берет ряд входных переменных и использует их для прогнозирования цели задания, как и при регрессии. В стандартной множественной линейной регрессии, например, если ставится задача предсказать уровень холесте-рола (зависимая переменная) на основе потребления жиров и физической нагрузки (независимые входные переменные), то данные будут моделироваться следующим образом: прогнозируемый уровень холестеро-ла = а + b х потребление жиров + с X нагрузку, где значения a, b и с будут определяться статистической процедурой. Будет производиться поиск множества решений задачи, которое может быть линией, плоскостью или гиперплоскостью (в зависимости от количества переменных) согласно правилу наименьших квадратов. В вышеприведенной задаче все решения находятся на плоскости: ось л: представляет потребление жиров, ось у—физическую нагрузку, высота плоскости в каждой точке (х, у) представляет собой прогнозируемый уровень холестерола.

Вам следует иметь от двух до пяти переменных. Чем меньше переменных, тем более надежны результаты. Интересное следствие такого подхода заключается в том, что он позволяет вам оглянуться на собственную проделанную работу и быстро понять, является ли она подгонкой под кривую. Вероятность того, что система окажется подогнанной под кривую, напрямую зависит от количества переменных, использовавшихся при тестировании. Чем большее количество технических исследований и правил (особенно исключений из правил), тем больше модель подогнана под кривую. Остерегайтесь систем, которые настолько сложны, что требуют компьютера для того, чтобы с ними работать. Другой путь избежать подстраивания под кривую - отказ от создания систем, настроенных на специфические рынки. Это ловушка, в которую просто попасть, и это также основной принцип подстраивания под кривую. Хорошая система не обязана исторически работать на всех рынках, чтобы быть успешной, но она должна работать на большинстве рынков с небольшим количеством изменений от рынка к рынку. Если вы должны изменять систему с тем, чтобы адаптировать ее к каждому рынку, то есть серьезный изъян в основной системе. Нам хорошо знаком тот аргумент, что каждый рынок обладает своим уникальным характером, но мы также помним времена, когда валютные фьючерсы практически не были волатильными, и времена, когда они демонстрировали колебания стоимости контрактов на тысячи долларов в день. Рынки меняются, и лучшим способом добиться уверенности, что

Этот способ называют также "слепым моделированием" или "тестированием за пределами выборки". Вы разрабатываете вашу систему на начальных данных (скажем, первые 5 лет 10-летнего набора данных) и затем тестируете без изменения то, что вы считаете вашей лучшей комбинацией параметров и правил на более свежем временном периоде. Если результат не устраивает-процесс повторяется. Оптимизируете вы или нет в первой фазе тестирования, это не так важно, как удерживание количества переменных на небольшом уровне. Самое важное, что любая торговая система, подвергаемая простому тестированию или оптимизации без опережающего тестирования, скорее всего будет обречена на провал. Опережающее тестирование является наиболее элегантным тестированием системы. Если ваша система не доказала свою прибыльность на процедуре опережающего тестирования, выбросьте ее.

Проще говоря, при малых объемах выпуска производственный процесс относительно неэффективен и дорог, поскольку имеющееся у фирмы оборудование оказывается недогруженным. С оборудованием фирмы соединяется недостаточное количество переменных ресурсов, эффективность производства чрезвычайно низка, а переменные издержки в расчете на единицу продукции соответственно относительно высоки. Однако по мере расширения производства более высокий уровень специализации рабочих и более полное использование капитального оборудования фирмы обеспечат рост эффективности производства. В результате переменные издержки в расчете на единицу продукции начинают снижаться. Вследствие применения все большего и большего количества переменных ресурсов в конце концов наступает момент, когда всту-

Основной недостаток модели с фиктивными переменными для описания сезонных и циклических колебаний — наличие большого количества переменных. Если, например, строить модель для описания помесячных периодических колебаний за несколько лет, то такая модель будет включать 12 независимых переменных (11 фиктивных переменных и фактор времени). В такой ситуации число степеней свободы невелико, что снижает вероятность получения статистически значимых оценок параметров уравнения регрессии.

Основной недостаток модели с фиктивными переменными для описания сезонных и циклических колебаний — наличие большого количества переменных. Если, например, строить модель для описания помесячных периодических колебаний за несколько лет, то такая модель будет включать 12 независимых переменных (11 фиктивных переменных и фактор времени). В такой ситуации число степеней свободы невелико, что снижает вероятность получения статистически значимых оценок параметров уравнения регрессии.

Многомерные методы. Эти методы предоставляют объективные количественные средства для исследования сходства, близости, группировки или классификации данных. Данные могут быть представлены в виде множества показателей, переменных, которые характеризуют объекты или один объект в разные моменты времени, например предприятие в различные годы. Большинство методов решают задачу уменьшения количества переменных и выделения наиболее важных характеристик, скрытых факторов. Отметим среди этих методов наиболее важные:

Обсудим некоторые особенности применения указанного метода для решения поставленной задачи. Задача в рассмотренной постановке является нелинейной и для большого количества переменных (неизвестных номеров событий) не всегда будет эффективно решаться с помощью процедуры Поиска решения. В таких случаях имеет смысл вначале ослабить требование единственности номера каждого события и заменить его требованием минимизации суммы квадратов отклонений количеств одинаковых номеров от единицы. Затем полученное решение можно использовать как начальное приближение в рассмотренном выше алгоритме. Следует также добавить, что нумерация одного и того же сетевого графика может быть неоднозначной, а, следовательно, существенно зависеть от начального приближения.


Квалификация персонала Квалификацией работника Квалификации начальное Квалификации преподавателей Категорию сложности Квалификации управленческого Квалификационных экзаменов Квалификационным справочником Квалификационной категории Квалификацию работников Квартальную бухгалтерскую Культурные потребности Культурных особенностей вывоз мусора снос зданий

Яндекс.Метрика