Роман Уфимцев, "1/F"

Несмотря на то, что в предлагаемом вашему вниманию тексте нет ни единой выдумки и подтасовки фактов, это ни в коем случае не "научная статья". Не обманывайтесь присутствием многочисленных диаграмм - это такое же свободное эссе, как и прочие материалы на нашем сайте. Но поскольку того требует тема, мы обратились к математическим средствам объяснять и доказывать свои соображения. И постарались, чтобы это было просто, понятно и интересно.

Итак, история начинается с ужасной банальности...

Динамика продаж

Если вы работаете в офисе, то наверняка не только знаете, что такое динамика продаж, но и видели графики, которыми принято её изображать. Ну, а если вы работаете руководителем, продавцом или маркетологом, вы уж наизусть помните ломаную кривую, которая отражает взлеты и падения продаж вашей компании. Эти графики обычно строят в "лучшем друге офисного работника", программе Excel и выглядят на редкость одинаково, примерно так:

Динамика продаж

Этот график я нашел в Интернете, поэтому не стоит удивляться, как хорошо и ровно растут продажи у этой компании (правда, с прогнозом на 2008-й они наверняка ошиблись). Гораздо чаще графики продаж представляют собой ломаную линию, в которой есть взлеты и падения - но их никто не станет выкладывать в Интернет. Даже график продаж этой компании оказался бы ломаным, если бы они построили график продаж по месяцам или неделям.

На таких графиках сразу видно, растут продажи или падают, а разложив продажи по месяцам и дням недели, можно увидеть сезонные и недельные колебания продаж. Но вот дневные графики продаж (один день - одна точка на графике) используются редко. Причина простая - график теряет свою наглядность, гладкость, на первый план выходят случайные флуктуации:

Колебания уровня продаж в линейной шкале

Это график, который мы построили по реальным данным продаж. На нем один столбик означает уровень продаж в один определённый день. Всего тут данные за 300 последовательных дней. Само собой, этот график кажется бесполезным - ведь за флуктуациями толком не видно основных тенденций. Но откуда они берутся и что это за флуктуации?

Типичный ответ: "эти флуктуации вызваны совершенно случайными причинами, в них нет никакой системы и информации, это статистические помехи, от которых нужно избавляться, усредняя данные по неделям, месяцам и годам" (как на красивом графике сверху).

Но не всё так просто. Очевидный и, кажется, правильный ответ о полной случайности и бессистемности флуктуаций продаж не верен. В этом статистическом шуме прячутся настоящие откровения о том, как устроены рынки и люди. Но прежде, нам нужно поговорить о шумах, о том, что это такое и какие виды шумов были найдены в природе.

Разновидности и цвета шумов

Вообще, шумом называют любой сигнал (а график динамики продаж тоже можно рассматривать как сигнал), который имеет нерегулярную, хаотическую форму. В таком сигнале всплески и падения сменяются с виду бессистемно, совершенно случайно. Тем не менее, как и любой сигнал, шум можно анализировать - точно так же, как анализируют любые сигналы. В том числе, можно выделить частотный спектр шума.

Из ВУЗ-овского курса математики вы, должно быть, помните, что любая функция может быть преобразована с помощью "преобразования Фурье". Это такая операция, которая позволяет представить функцию (или сигнал) в виде её спектральных составляющих. То есть, любой сигнал можно представить в виде суммы колебаний различных частот. Для разных типов сигналов амплитуды колебаний на различных частотах различаются, и когда мы строим график, на котором по оси X откладывается частота колебаний, а по оси Y - их амплитуда, мы получаем спектр сигнала:

Частотный спектр сигнала

Во многих компьютерных (и не только) музыкальных проигрывателях есть функция отображения спектра музыки, наподобие этого. Тут по спектру видно, что в играющей музыке преобладают низкие частоты, и что в районе частоты в 800 Гц. присутствует пик, который связан с резонансом какого-то инструмента.

Спектр шума дает о нём очень красноречивую информацию, поэтому сегодня принято классифицировать различные виды шумов как раз по особенностям их спектра. Среди всего их многообразия наибольшее значение имеет три типа шумов: белый шум, коричневый шум и розовый шум.

Белый, розовый и коричневый шум

Мы начнем с белого шума. Это "абсолютный" шум - единственный вид шума, в котором нет никакой системы, лишь полная случайность. Чтобы его получить, нужно обратиться к случаю - например, взять числа от 1 до 1000, наугад их выбирать и записывать. У нас получится совершенно случайная последовательность чисел, и если её изобразить на графике, мы получим классический вид белого шума.

Коричневый шум можно получить другим способом. Мы будем выбирать наугад числа от -500 до +500 и прибавлять их к значению предыдущего числа. То есть, если первое значение равно 103, а нам случайно выпало число 67, то следующее значение будет 170.

Если мы построим так длинную последовательность значений, мы получим коричневый шум. Он выглядит более гладким, не таким изрезанным, как белый шум: график не прыгает, а случайно "бродит" то вверх, то вниз. Сам способ получения коричневого шума называется алгоритмом случайного блуждания. Считается, что именно так двигаются мелкие частицы под действием броуновского движения. Это отражено и в самом названии шума: на самом деле он не коричневый, а "brown" - по фамилии открывателя броуновского движения. По совпадению, "brown" по-английски означает коричневый цвет. Обратим внимание, что коричневый шум не совсем случаен: каждая следующая точка графика строится на основе положения предыдущих точек, а не "с нуля". Поэтому говорят, что броуновский шум отражает процесс с памятью: следующая точка возникает хотя и случайно, но исходя их предшествующих (при этом направление броуновского движения не зависит от предыдущего направления). У белого шума таких свойств нет.

Наконец, розовый шум. О нём мы пока лишь скажем, что он находится посредине между белым и коричневым, что заметно по его виду - с одной стороны, он не такой хаотичный, как белый шум, а с другой - не такой приглаженный, как коричневый.

Спектры цветных шумов

Теперь самое время обратиться к спектрам этих трёх основных видов шумов, чтобы увидеть их особенности. Сделаем лишь два замечания:

  • В реальности, на спектрах сигналов по оси Y принято отображать не амплитуду сигнала на определённой частоте, а квадрат амплитуды - его называют мощностью сигнала на этой частоте. Эта привычка пришла из физики, которая первая взялась за исследование различных колебаний. А для физики важнее не амплитуда колебаний, а количество энергии, в них заключённое. Это количество пропорционально квадрату амплитуды колебаний, поэтому на спектрах принято отражать именно квадраты амплитуд.

  • Очень часто спектры строят не в линейной шкале, а в логарифмической. Если вы взглянете на спектр музыки выше, вы сможете заметить, что горизонтальная шкала не линейная, а логарифмическая: промежуток от 100 Гц. до 1000 Гц. ("1К") имеет такую же длину, что и промежуток от 1000 Гц до 10000 Гц. ("10К"). То же самое и по оси Y: в звуковых анализаторах спектра мощность сигнала меряют в децибеллах, это специальная логарифмическая единица мощности звука. Логарифмические шкалы позволяют в одном спектре сразу уложить большой диапазон частот и мощностей сигнала. Кроме того, логарифмические спектры гораздо лучше соответствуют свойствам нашего восприятия - для человека гораздо заметнее разница между звуком с частотой в 40 Гц. и 50 Гц., чем между звуками с частотой в 1040 Гц. и 1050 Гц. На линейной шкале эта разница имела бы одинаковый размер, а на логарифмической - первая разница выглядит больше второй. То же самое верно и относительно громкости звука. Мы также будем пользоваться далее логарифмическими спектрами, тем более, что они как нельзя лучше подходят для отображения спектров различных шумов.

Спектр белого шума

Итак, сначала взглянем на спектр белого шума. С помощью программы MATLAB мы построили длинную последовательность случайных чисел и рассчитали логарифмический спектр получившегося сигнала:

Спектр белого шума в логарифмической шкале

Первое, что сразу бросается в глаза - спектр белого шума примерно ложится на горизонтальную линию. Если провести множество числовых экспериментов, спектр будет совершенно горизонтальным. Из-за того, что числа "полностью случайны", в белом шуме обнаружилась ясная система, которую вовсе не легко было бы предугадать, принимая во внимание сам способ его получения - аналог бросания костей.

На спектре также проведены три прямых линии. Мы имеем дело с логарифмической шкалой и вид различных кривых в ней изменяется по сравнению с линейной. В частности, все кривые соответствующие простым степенным математическим функциям типа y=1/x или y=1/x² приобретает в логарифмической шкале вид прямых линий различного наклона. На нашем спектре три таких линии:

  • 1/f² - соответствует случаю, когда мощность сигнала обратно пропорциональна квадрату частоты.

  • 1/f - соответствует случаю, когда мощность сигнала обратно пропорциональна частоте (чем выше частота, тем пропорционально меньше мощность).

  • 1/fº - соответствует случаю, когда мощность сигнала одинакова на всех частотах. (Обозначается как f в степени 0, из математики мы знаем, что любое число в нулевой степени равно единице).

Положение этих кривых по вертикали не имеет значения (от этого сама функция существенно не меняется). Важен лишь их наклон - он зависит от степени f. Спектр белого шума ложится на горизонтальную кривую 1/fº - это значит, что мощность белого шума на всех частотах одинакова.

Спектр коричневого шума

Далее мы обращаемся к коричневому шуму. Спектр шума, полученного по алгоритму случайного блуждания тоже ложится на линию, на этот раз на линию 1/f²:

Спектр коричневого шума в логарифмической шкале

Спектр розового шума

Если спектр белого шума ложится на линию 1/fº, а спектр коричневого - на линию 1/f², то совершенно естественно полагать, что спектр промежуточного, розового шума, должен ложится на линию 1/f. Так оно и есть. Именно шум со спектром, который ложится на линию, примерно соответствующую 1/f, принято называть розовым шумом ("pink noise"). В природе известно множество случаев, когда шум "почти" розовый - то есть, когда показатель степени f не равен 1, но близок к нему.

Розовый шум: pink noise

Как получить розовый шум? Белый мы можем получить простым перебором случайных чисел. Коричневый - алгоритмом случайного блуждания. Но как таким же простым способом получить розовый? Поразительно, но простого математического метода получить розовый шум так и не нашли. Розовый шум, проявляясь в совершенно различных явлениях природы, - от звуков человеческой речи и шума полупроводников до распределения кратеров на Луне и размера городов в США, - остаётся непонятным по происхождению. К слову, о шумах в природе...

Шумы в природе

Все три основных типа шумов широко распространены:

  • Там, где случайным образом смешиваются разные факторы, возникает белый шум - его можно услышать, например, настроив старый радиоприемник на волну, в которой нет радиостанций. Другой пример - тепловой шум в полупроводниках. Он создается хаотическими колебаниями атомов и при большом усилении его вполне слышно в любом звуко-воспроизводящем устройстве. Происхождение белого шума понятно - ведь это просто игра случая.

  • Коричневый шум также широко распространен в природе, и это неудивительно: он порождается случайным блужданием. Например, ему соответствуют волны морского прибоя и броуновское движение частиц.

  • Розовый шум, несмотря на непонятное происхождение, встречается чрезвычайно широко. Впервые он обратил на себя внимание, когда физики заметили, что некоторые полупроводниковые приборы как-то странно шумят. Кроме обычного теплового белого шума они обнаружили присутствие шума, в котором было больше низких и очень низких частот. Оказалось, что мощность этого шума обратно пропорциональна его частоте и это соотношение верно даже для частот в тысячные доли герца. Это значит, что в полупроводниках происходят какие-то процессы длиной в несколько дней и больше, которые и порождают этот шум. Его назвали "фликкер-шумом", т.е. мерцающим шумом - теперь это другое название розового шума. А после его стали находить повсюду - в интенсивности дорожного движения, в электроэнцефалограммах, в динамике разливов рек, в интенсивности космических излучений, в климатических данных, даже звуки человеческой речи и музыка имеют в среднем спектр розового шума - и это лишь малая часть всех известных проявлений шума 1/f. Пожалуй, ни один другой вид шума не распространен так широко в самых разных явлениях природы. И при этом его происхождение остаётся загадкой...

Совершив короткий экскурс в увлекательный мир шумов, мы готовы вернуться к шумам в динамике продаж. Какой именно тип шума мы видим, когда разглядываем изрезанные графики дневных продаж? Абсолютно случайный белый? Блуждающий коричневый? Или, быть может, розовый шум?

Мерцающая динамика продаж

Чтобы ответить на вопрос, какой именно тип шума мы наблюдаем в скачущей ото дня ко дню динамике продаж, мы взяли реальные данные продаж одной нашей "знакомой" компании за 1030 дней наблюдения - то есть, почти за три года. В первой части статьи мы приводили его вид за 300 дней - изрезанный, очень зашумлённый график. А далее мы проанализировали эти данные так же, как анализировали белый и коричневый шум. Вот что получилось:

Спектр колебаний уровня продаж в логарифмической шкале

Несмотря на то, что спектр не гладкий, как у чистого белого или коричневого шума (для получения гладкого спектра нужно гораздо больше данных, чем за 1030 дней), можно сделать некоторые наблюдения:

  • Спектр шума в динамике продаж, определённо, не соответствует белому шуму. Колебания продаж не соответствуют полностью случайному процессу.

  • Спектр шума также не соответствует и коричневому шуму, то есть, флуктуации продаж не являются и продуктом случайного блуждания.

  • Ближе и полнее всего спектр шумов в динамике продаж соответствует розовому шуму.

  • Заметны пики, связанные с недельными циклами продаж.

Как же компаниям удаётся действовать среди шума? Вспомним: мы говорили, что коричневый шум, в отличие от белого, имеет память - каждое следующее значение получается исходя из предыдущего (но не направление и не приращение - там зависимости нет). Розовый шум также обладает памятью - он тоже не полностью случаен, как белый.

Заключение

Чтобы уверенно утверждать, что динамика продаж является (или не является) розовым шумом, необходимо проанализировать гораздо больше данных - от разных компаний, за длительные промежутки времени. Но и на основе измерений имеющихся данных можно утверждать, что казалось бы случайные ежедневные флуктуации продаж имеют память и являются проявлением общесистемной динамики.