|
Нормально распределенных
Однако для обеспечения надежности прогнозирования необходимо исследовать случайную компоненту временного ряда, определить характер (закон) распределения случайных величин. Если случайные величины е f нормально распределены и между собой независимы, тогда определяются интервалы [34, 54] , в которые с определенной вероятностью попадают значения полученного нами прогноза.
Дневная выручка от реализации небольшой компании представляет собой нормальное распределение со средней в 10 000 долл. США и среднеквадрати-ческим отклонением в 3000 долл. Дневную выручку от реализации можно смоделировать с помощью таблиц случайных нормальных отклонений. Далее в таблице приведены также случайные числа, выданные с помощью компьютера. Эти числа — случайные величины, которые нормально распределены со средним, равным 0, и среднеквадратическим отклонением, равным 1.
Значение V — непредсказуемые колебания, которые в целом нормально распределены со средним 0 и среднеквадратическим отклонением 1000 долл.
Напомним, что, строго говоря, статистический анализ применим к статистически однородным случайно изменяющимся величинам, т. е. обладающим малыми флуктуациями относительно средней. Такие величины обладают определенными свойствами стабильности и асимптотически нормально распределены. В нефтепереработке к ним можно отнести производительности установок, коэффициенты отбора полупродуктов производства, показатели качества вырабатываемых фракций.
Проверка гипотезы о том, что ошибки нормально распределены
Идентификация закона распределения случайной величины изучена в главе 6, поэтому здесь мы не будем подробно рассматривать этот вопрос. Кратко можно сказать, что проверка гипотезы о том, что ошибки МНК нормально распределены, проводится в два этапа:
Проверка гипотезы о том, что ошибки нормально распределены
Для проверки гипотезы о том, что ошибки нормально распределены, нам необходимо построить гистограмму выборочного распределения величины е.
сматриваем сделки, P&L в которых меньше, чем 0,330129 - (1,743232 * 2) = = -3,1563, или больше, чем 0,330129 + (1,743232 * 2) = 3,816593. Мы сейчас создали распределение торговых P&L системы. Распределение содержит 10 точек данных, так как мы решили работать с 10 ячейками. Каждая точка данных отражает число сделок, которые попадают в эту ячейку Каждая сделка не может попасть более чем в 1 ячейку и если сделка находится за пределами 2 стандартных единиц с любой стороны среднего (P&L < -3,156335 или > 3,816593), тогда она не будет представлена в этом распределении. Рисунок 3-16 показывает распределение, которое мы только что рассчитали. Может показаться, что распределение P&L торговой системы должно всегда быть смещено вправо за счет больших выигрышей. Наше распределение 232 торговых P&L представляет систему, которая в основном приносит небольшие прибыли. Многие трейдеры имеют ошибочное мнение, что распределение P&L должно быть смещено вправо для всех торговых систем. Это не всегда верно, что и подтверждает рисунок 3-16. Разные рыночные системы имеют различные распределения, и вам не следует ожидать, что все они будут одинаковыми. Также на рисунке 3-16 показано нормальное распределение для 232 торговых P&L, если бы они были нормально распределены. Это было сделано для того, чтобы вы могли графически сравнить торговые P&L для полученного и нормального распределения. Сначала нормальное распределение рассчитывается для границ каждой ячейки. Для самой левой ячейки это Z =-2 и Z=-l,6. Теперь подставим полученные значения Z в уравнение (3.21), чтобы рассчитать вероятность. В нашем примере это соответствует 0,02275 для Z = -2 и 0,05479932 для Z = -1,6. Затем возьмем абсолютное значение разности этих двух значений, которое в нашем примере будет ABS(0,02275 - 0,05479932) = = 0,03204932. Затем умножим полученный ответ на количество точек данных, то есть на 232 (мы все еще должны использовать 232 сделки, хотя некоторые исключаются, так как находятся вне диапазона выбранных ячеек). Таким образом, если бы данные были нормально распределены и размещены в 10 ячеек равной ширины между -2 и +2 сигма, тогда самая левая ячейка содержала бы 0,03204932 * 232 = 7,43544224 элемента. Если сделать расчет для каждой из 10 ячеек, мы получим нормальную кривую, показанную на рисунке 3-16.
Сейчас мы разработаем метод поиска оптимального f по нормально распределенным данным. Как и формула Келли, это способ относится к параметрическим методам. Однако он намного мощнее, так как формула Келли отражает только два возможных результата события, а этот метод позволяет получить полный спектр результатов (при условии, что результаты нормально распределены). Удобство нормально распределенных результатов (кроме того факта, что в реальности они часто являются пределом многих других распределений) состоит в том, что их можно описать двумя параметрами. Формулы Келли дадут вам оптимальное f для бернуллиевых результатов, если известны два параметра: отношение выигрыша к проигрышу и вероятность выигрыша. Метод расчета оптимального f, о котором мы сейчас расскажем, также требует только два параметра — среднее значение и стандартное отклонение результатов. Вспомним, что нормальное распределение является непрерывным распределением. Для того, чтобы использовать этот метод, необходимо дискретное распределение. Далее вспомним, что нормальное распределение является неограниченным распределением. Первые два шага, которые мы должны сделать для нахождения оптимального f по нормально распределенным данным, — это определить, (1) на сколько сигма от среднего значения мы усекаем распределение и (2) на сколько равноотстоящих точек данных мы разделим интервал между двумя крайними точками, найденными в (1). Например, мы знаем, что 99,73% всех точек данных находятся между плюс и
Однако, как мы увидим позже, многое говорит в пользу того, что будущее распределение цен будет нормальным. Когда мы покупаем или продаем опцион, предположение, что будущее распределение изменений цены базового инструмента будет нормальным, уже заложено в цену опциона. Точно так же можно сказать, что трейдеры, не использующие механические системы, получат в будущем результаты, которые нормально распределены. Основные гипотезы о средних величинах следующие: гипотезы о значении генеральной средней (при известной генеральной дисперсии или при неизвестной генеральной дисперсии); гипотезы о равенстве генеральных средних нормально распределенных совокупностей (при известных генеральных дисперсиях, при неизвестных равных генеральных дисперсиях, при неизвестных неравных генеральных дисперсиях).
Из формул (2.34), (2.36) следует, что линии регрессии Му (X) и MX(Y) нормально распределенных случайных величин представляют собой прямые линии, т. е. нормальные регрессии Y по X и X по Y всегда линейны.
Для нормально распределенных случайных величин термины «некоррелированность» и «независимость» равносильны.
В этом случае гипотеза о гомоскедастичности будет равносильна тому, что значения е\,..., ет и en-m+i,..., е„ (т. е. остатки е, регрессии первых и последних т наблюдений) представляют собой выборочные наблюдения нормально распределенных случайных величин, имеющих одинаковые дисперсии.
Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей, как известно (см., например, [12]), проверяется с помощью критерия Фишера—Снедекора.
где v, (t— 1,..., и) представляет белый шум, т. е. последовательность независимых нормально распределенных случайных величин с нулевой средней и дисперсией а2,; р — параметр, называемый коэффициентом авторегрессии.
- - нормально распределенных случайных величин 40
Заметим также, что случайные величины у* колеблются вблизи х° так, что их можно отнести к семейству нормально распределенных.
Чем больше величина а или а2, тем сильнее разброс значений вокруг среднего. Следует отметить, что о всегда больше модуля среднего линейного отклонения. Для нормально распределенных величин сг/а«1,2. Если же такое соотношение не выполняется, это свидетельствует о том, что в исследуемом массиве данных есть элементы, неоднородные с основной массой, сильно выбивающиеся по своей величине из общего ряда. В зависимости от природы решаемой задачи следует подумать об исключении этих единиц из рассмотрения вообще либо не использовать их при построении некоторых моделей, поскольку они являются в своем роде исключениями из общего правила.
Рис. 4.2.3. Вид плотности распределения для суммы логарифмически нормально распределенных случайных величин
Мы немного познакомились с математикой нормального и логарифмически нормального распределения и теперь посмотрим, как находить оптимальное f по нормально распределенным результатам. Формула Келли является примером параметрического оптимального f, где f является функцией двух параметров. В формуле Келли вводные параметры — это процент выигрышных ставок и отношение выигрыша к проигрышу. Однако формула Келли даст вам оптимальное f только тогда, когда возможные результаты имеют бернуллиево распределение. Другими словами, формула Келли даст правильное оптимальное f, когда есть только два возможных результата, в противном случае, как, например, в нормально распределенных результатах, формула Келли не даст вам правильное оптимальное f2.
Нелинейное программирование Нематериальными операциями Немедленного использования Немногими исключениями Ненадлежащее исполнение Неналоговые поступления Неоазиатская бюрократия Необеспеченные облигации Необходимые экономические Необходимые инвестиции Необходимые комментарии Национального правительства Необходимые параметры вывоз мусора снос зданий
|
|
|
|