|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
М.: МЗ-Пресс, 2004. Глава 4. Статистика интервальных данных 4.2. Интервальные данные в задачах оценивания Поясним теоретические концепции статистики интервальных данных на простых примерах. Пример 1. Оценивание математического ожидания. Пусть необходимо оценить математическое ожидание случайной величины с помощью обычной оценки - среднего арифметического результатов наблюдений, т.е. Тогда при справедливости ограничений (1) на абсолютные погрешности имеем Поскольку то в обозначениях предыдущего пункта Следовательно, рациональный объем выборки равен Для практического использования полученной формулы надо оценить дисперсию результатов наблюдений. Можно доказать, что, поскольку Здесь и далее рассуждения часто идут на двух уровнях. Первый - это уровень "истинных" случайных величин, обозначаемых "х", описывающих реальность, но неизвестных специалисту по анализу данных. Второй - уровень известных этому специалисту величин "у", отличающихся погрешностями от истинных. Погрешности малы, поэтому функции от х отличаются от функций от у на некоторые бесконечно малые величины. Эти соображения и позволяют использовать s2(y) как оценку D(x1). Итак, выборочной оценкой рационального объема выборки является Уже на этом первом рассматриваемом примере видим, что рациональный объем выборки находится не где-то вдали, а непосредственно рядом с теми объемами, с которыми имеет дело любой практически работающий статистик. Например, если статистик знает, что По сравнению с классической математической статистикой доверительный интервал для математического ожидания (для заданной доверительной вероятности
где По поводу формулы (4) была довольно жаркая дискуссия среди специалистов. Отмечалось, что она получена на основе Центральной Предельной Теоремы теории вероятностей и может быть использована при любом распределении результатов наблюдений (с конечной дисперсией). Если же имеется дополнительная информация, то, по мнению отдельных специалистов, формула (4) может быть уточнена. Например, если известно, что распределение xi является нормальным, в качестве u( Применительно к оцениванию математического ожидания (но не к оцениванию других характеристик или параметров распределения) факт существования границы возможной точности, определяемой точностью исходных данных, не0днократно отмечался в литературе ([26, с.230-234], [31, с.121] и др.). Пример 2. Оценивание дисперсии. Для статистики f(y) = s2(y), где s2(y) - выборочная дисперсия (несмещенная оценка теоретической дисперсии), при справедливости ограничений (1) на абсолютные погрешности имеем Можно показать, что нотна Nf(y) сходится к по вероятности с точностью до Известно, что случайная величина является асимптотически нормальной с математическим ожиданием 0 и дисперсией Из сказанного вытекает, что в статистике интервальных данных асимптотический доверительный интервал для дисперсии где где Рациональный объем выборки при оценивании дисперсии равен а выборочную оценку рационального объема выборки Что можно сказать о численной величине рационального объема выборки? Как и в случае оценивания математического ожидания, она отнюдь не выходит за пределы обычно используемых объемов выборок. Так, если распределение результатов наблюдений где Пример 3. Аддитивные статистики. Пусть Тогда по вероятности при
при ограничениях (1) на абсолютные ошибки и в замкнутом интервале
при ограничениях на относительные погрешности результатов наблюдений. Обратим внимание, что длины этих интервалов независимы от объема выборки, в частности, не стремятся к 0 при его росте. К каким последствиям это приводит в задачах статистического оценивания? Поскольку для статистик аддитивного типа
по вероятности при Как известно, в рамках классической математической статистики в предположении существования ненулевой дисперсии Dg(x1) в силу асимптотической нормальности аддитивной статистики f(x) асимптотический доверительный интервал, соответствующий доверительной вероятности где s(g(x)) – выборочное среднее квадратическое отклонение, построенное по g(x1), g(x2),…, g(xn), а В рассматриваемой модели порождения интервальных данных вместо f(x) необходимо использовать f(y), а вместо g(xi) – соответственно g(yi), i-1,2,…,n. При этом доверительный интервал необходимо расширить с учетом формул (5) и (6). В соответствии с проведенными рассуждениями для аддитивных статистик асимптотическая нотна имеет вид при ограничениях (1) на абсолютную погрешность и при ограничениях на относительную погрешность. В первом случае нотна является обобщением понятия предельной абсолютной систематической ошибки, во втором – предельной относительной систематической ошибки. Отметим, что, как и в примерах 1 и 2, асимптотическая нотна не зависит от точки, в которой вычисляется. Таким образом, она является константой для конкретного метода статистического анализа данных. Поскольку n велико, а В статистике интервальных данных выборочный доверительный интервал для Mg(x1) имеет вид В асимптотике его длина такова:
где Для аддитивных статистик при больших n максимум (по возможным погрешностям) среднего квадрата отклонения оценки имеет вид
с точностью до членов более высокого порядка. Исходя из принципа уравнивания погрешностей в общей схеме устойчивости [3], нецелесообразно второе слагаемое в (9) делать меньше первого за счет увеличения объема выборкиn. Рациональный объем выборки, т.е. тот объем, при котором равны погрешности оценивания (или проверки гипотез), вызванные погрешностями исходных данных, и статистические погрешности, рассчитанные по обычным правилам математической статистики (при
В качестве примера рассмотрим экспоненциально распределенные результаты наблюдений В частности, если относительная погрешность измерений Пример 4. Оценивание медианы распределения с помощью выборочной медианы. Хотя нельзя выделить главный линейный член из-за недифференцируемости функции f(x), выражающей выборочную медиану через элементы выборки, непосредственно из определения нотны следует, что при ограничениях на абсолютные погрешности
а при ограничениях на относительные погрешности с точностью до бесконечно малых более высокого порядка, где
где где при ограничениях на абсолютные и относительные погрешности результатов измерений соответственно. Для практического использования этих формул следует оценить плотность распределения результатов измерений в одной точке - теоретической медиане. Это можно сделать с помощью тех или иных непараметрических оценок плотности [27]. Если результаты наблюдений имеют стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1, то В этом случае рациональный объем выборки в Пример 5. Оценивание коэффициента вариации. Рассмотрим выборочный коэффициент вариации Как нетрудно подсчитать, В случае ограничений на относительную погрешность На основе этого предельного соотношения и формулы для асимптотической дисперсии выборочного коэффициента вариации, приведенной в [27], могут быть найдены по описанной выше схеме доверительные границы для теоретического коэффициента вариации и рациональный объем выборки. Замечание. Отметим, что формулы для рационального объема выборки получены на основе асимптотической теории, а применяются для получения конечных объемов – 36 и 100 в примерах 1-3. Как всегда при использовании асимптотических результатов математической статистики, необходимы дополнительные исследования для изучения точности асимптотических формул при конечных объемах выборок. Рассмотрим классическую в прикладной математической статистике параметрическую задачу оценивания. Исходные данные – выборка считаются наборомx1, x2, ..., xn, состоящая из n действительных чисел. В вероятностной модели простой случайной выборки ее элементы x1, x2, ..., xn реализаций n независимых одинаково распределенных случайных величин. Будем считать, что эти величины имеют плотность f(x). В параметрической статистической теории предполагается, что плотность f(x) известна с точностью до конечномерного параметра, т.е.,при некотором Все результаты наблюдений определяются с некоторой точностью, в частности, записываются с помощью конечного числа значащих цифр (обычно 2 – 5). Следовательно, все реальные распределения результатов наблюдений дискретны. Обычно считают, что эти дискретные распределения достаточно хорошо приближаются непрерывными. Уточняя это утверждение, приходим к уже рассматривавшейся модели, согласно которой статистику доступны лишь величины yj = xj + где xi – «истинные» значения, образуют простую случайную выборку из некоторого двумерного распределения, причем x1, x2, ..., xn - выборка из распределения с плотностью . Необходимо учитывать, что Пусть В дальнейшем изложение идет на примере оценивания параметров гамма-распределения, хотя аналогичные результаты можно получить и для других параметрических семейств, а также для задач проверки гипотез (см. ниже) и т.д. Наша цель – продемонстрировать основные черты подхода статистики интервальных данных. Его разработка была стимулирована подготовкой ГОСТ 11.011-83 [4]. Отметим, что постановки статистики объектов нечисловой природы соответствуют подходу, принятому в общей теории устойчивости [3,27]. В соответствии с этим подходом выборке x = (x1, x2, ..., xn) ставится в соответствие множество допустимых отклонений G(x), т.е. множество возможных значений вектора результатов наблюдений y = (y1,y2, ..., yn). Если известно, что абсолютная погрешность результатов измерений не превосходит Если известно, что относительная погрешность не превосходит Теория устойчивости позволяет учесть «наихудшие» отклонения, т.е. приводит к выводам типа минимаксных, в то время как конкретные модели погрешностей позволяют делать заключения о поведении статистик «в среднем». Оценки параметров гамма-распределения. Как известно, случайная величина Х имеет гамма-распределение, если ее плотность такова [4]: где a – параметр формы, b – параметр масштаба, Поскольку M(X) = ab, D(X) = ab2, то оценки метода имеют вид где
с точностью до бесконечно малых более высокого порядка. Оценка максимального правдоподобия a* имеет вид [4]:
где При больших n с точностью до бесконечно малых более высокого порядка Как и для оценок метода моментов, оценка максимального правдоподобия b* параметра масштаба имеет вид При больших n с точностью до бесконечно малых более высокого порядка Используя свойства гамма-функции, можно показать [4], что при больших а с точностью до бесконечно малых более высокого порядка. Сравнивая с формулами (11), убеждаемся в том, что средние квадраты ошибок для оценок метода моментов больше соответствующих средних квадратов ошибок для оценок максимального правдоподобия. Таким образом, с точки зрения классической математической статистики оценки максимального правдоподобия имеют преимущество по сравнению с оценками метода моментов. Необходимость учета погрешностей измерений. Положим Из свойств функции
В силу состоятельности оценки максимального правдоподобия a* из формулы (13) следует, что Согласно модели статистики интервальных данных результатами наблюдений являются не xi, а yi, вместо v по реальным данным рассчитывают Имеем
В силу закона больших чисел при достаточно малой погрешности по вероятности (в предположении, что все погрешности одинаково распределены). Таким образом, наличие погрешностей вносит сдвиг, вообще говоря, не исчезающий при росте объема выборки. Следовательно, если где величина a*(y) определена по формуле (12) с заменой xi на yi, i=1,2,…,n. Из формулы (13) следует [4], что
т.е. влияние погрешностей измерений увеличивается по мере роста а. Из формул для v и w следует, что с точностью до бесконечно малых более высокого порядка
С целью нахождения асимптотического распределения w выделим, используя формулу (16) и формулу для v, главные члены в соответствующих слагаемых
Таким образом, величина w представлена в виде суммы независимых одинаково распределенных случайных величин (с точностью до зависящего от случая остаточного члена порядка 1/n). В каждом слагаемом выделяются две части – одна, соответствующая Мб и вторая, в которую входят Из асимптотического совпадения дисперсий v и w, вида параметров асимптотического распределения (при
Соотношение (18) уточняет утверждение о несостоятельности a*. Из него следует также, что не имеет смысла безгранично увеличивать объем выборки n с целью повышения точности оценивания параметра а, поскольку при этом уменьшается только второе слагаемое в (18), а первое остается постоянным. В соответствии с общим подходом статистики интервальных данных в стандарте [4] предлагается определять рациональный объем выборки nrat определять из условия «уравнивания погрешностей» (это условие было впервые предложено в монографии [3]) различных видов в формуле (18), т.е. из условия Упрощая это уравнение в предположении Согласно сказанному выше, целесообразно использовать лишь выборки с объемами Применение методов теории устойчивости. Найдем асимптотическую нотну. Как следует из вида главного линейного члена в формуле (17), решение оптимизационной задачи соответствующей ограничениям на абсолютные погрешности, имеет вид
при a>1, где Таким образом, с точностью до бесконечно малых более высокого порядка нотна имеет вид Применим полученные результаты к построению доверительных интервалов. В постановке классической математической статистики (т.е. при где В постановке статистики интервальных данных (т.е. при где в вероятностной постановке (пары Если ограничения наложены на предельную относительную погрешность, задана величина (I). Относительная погрешность суммы заключена между наибольшей и наименьшей из относительных погрешностей слагаемых. (II). Относительная погрешность произведения и частного равна сумме относительных погрешностей сомножителей или, соответственно, делимого и делителя. Можно показать, что в рамках статистики интервальных данных с ограничениями на относительную погрешность правила (I) и (II) являются строгими утверждениями при Обозначим относительную погрешность некоторой величины t через ОП(t), абсолютную погрешность – через АП(t). Из правила (I) следует, что ОП( Поскольку рассмотрения ведутся при
по вероятности при Поскольку при справедливости (19) с точностью до бесконечно малых более высокого порядка то с помощью трех последних соотношений имеем
Применим еще одно правило приближенных вычислений [32, с.142]. (III). Предельная абсолютная погрешность суммы равна сумме предельных абсолютных погрешностей слагаемых. Из (20) и правила (III) следует, что
Из (15) и (21) вытекает [4, с.44, ф-ла (18)], что откуда в соответствии с ранее полученной формулой для рационального объема выборки с заменой В частности, при a = 5,00, Таблица 1. Наработка резцов до предельного состояния, ч
В соответствии с ранее проведенными рассмотрениями асимптотический доверительный интервал для a, соответствующий доверительной вероятности В частности, при При больших а в силу соображений, приведенных при выводе формулы (19), можно связать между собой относительную и абсолютную погрешности результатов наблюдений xi :
Следовательно, при больших а имеем Таким образом, проведенные рассуждения дали возможность вычислить асимптотику интеграла, задающего величинуА. Сравнение методов оценивания. Изучим влияние погрешностей измерений (с ограничениями на абсолютную погрешность) на оценку Погрешность s2 зависит от способа вычисления s2. Если используется формула
то необходимо использовать соотношения По сравнению с анализом влияния погрешностей на оценку а* здесь возникает новый момент – необходимость учета погрешностей в случайной составляющей отклонения оценки
тогда Если вычислять s2 по формуле
то аналогичные вычисления дают, что т.е. погрешность при больших а существенно больше. Хотя правые части формул (22) и (24) тождественно равны, но погрешности вычислений по этим формулам весьма отличаются. Связано это с тем, что в формуле (24) последняя операция – нахождение разности двух больших чисел, примерно равных по величине (для выборки из гамма-распределения при большом значении параметра формы). Из полученных результатов следует, что При выводе этой формулы использована линеаризация влияния погрешностей (выделение главного линейного члена). Используя связь (21) между абсолютной и относительной погрешностями, можно записать Эта формула отличается от приведенной в [4, с.44, ф-ла (19)] поскольку в [4] вместо (23) использовалась оценка Используя соотношение (23), мы характеризуем влияние погрешностей «в среднем». Доверительный интервал, соответствующий доверительной вероятности 0,95, имеет вид Если Необходимо выбрать способ сравнения двух методов оценивания параметра а, поскольку в длины доверительных интервалов входят две составляющие – зависящая от доверительной вероятности и не зависящая от нее. Выберем
а оценке
Ясно, что больших а или больших n справедливо неравенство Из (25) и (26) элементарными преобразованиями получаем следующее правило принятия решений. Если то Пример анализа реальных данных опубликован в [4]. На основе рассмотрения проблем оценивания параметров гамма-распределения можно сделать некоторые общие выводы. Если в классической теории математической статистики: а) существуют состоятельные оценки an параметра а, б) для повышения точности оценивания объем выборки целесообразно безгранично увеличивать; в) оценки максимального правдоподобия лучше оценок метода моментов, то в статистике интервальных данных, учитывающей погрешности измерений, соответственно: а) не существует состоятельных оценок: для любой оценки an существует константа с такая, что б) не имеет смысла рассматривать объемы выборок, большие «рационального объема выборки» в) оценки метода моментов в обширной области параметров Ясно, что приведенные выше результаты справедливы не только для рассмотренной задачи оценивания параметров гамма-распределения, но и для многих других постановок прикладной математической статистики. Метрологические, методические, статистические и вычислительные погрешности. Целесообразно выделить ряд видов погрешностей статистических данных. Погрешности, вызванные неточностью измерения исходных данных, называем метрологическими. Их максимальное значение можно оценить с помощью нотны. Впрочем, выше на примере оценивания параметров гамма-распределения показано, что переход от максимального отклонения к реально имеющемуся в вероятностно-статистической модели не меняет выводы (с точностью до умножения предельных значений погрешностей Методические погрешности вызваны неадекватностью вероятностно-статистической модели, отклонением реальности от ее предпосылок. Неадекватность обычно не исчезает при росте объема выборки. Методические погрешности целесообразно изучать с помощью «общей схемы устойчивости» [3,27], обобщающей популярную в теории робастных статистических процедур модель засорения большими выбросами. В настоящей главе методические погрешности не рассматриваются. Статистическая погрешность – это та погрешность, которая традиционно рассматривается в математической статистике. Ее характеристики – дисперсия оценки, дополнение до 1 мощности критерия при фиксированной альтернативе и т.д. Как правило, статистическая погрешность стремится к 0 при росте объема выборки. Вычислительная погрешность определяется алгоритмами расчета, в частности, правилами округления. На уровне чистой математики справедливо тождество правых частей формул (22) и (24), задающих выборочную дисперсию s2, а на уровне вычислительной математики формула (22) дает при определенных условиях существенно больше верных значащих цифр, чем вторая [34, с.51-52]. Выше на примере задачи оценивания параметров гамма-распределения рассмотрено совместное действие метрологических и вычислительных погрешностей, причем погрешности вычислений оценивались по классическим правилам для ручного счета [32]. Оказалось, что при таком подходе оценки метода моментов имеют преимущество перед оценками максимального правдоподобия в обширной области изменения параметров. Однако, если учитывать только метрологические погрешности, как это делалось выше в примерах 1-5, то с помощью аналогичных выкладок можно показать, что оценки этих двух типов имеют (при достаточно больших n) одинаковую погрешность. Вычислительную погрешность здесь подробно не рассматриваем. Ряд интересных результатов о ее роли в статистике получили Н.Н.Ляшенко и М.С.Никулин [35]. Проведем сравнение методов оценивания параметров в более общей постановке. В теории оценивания параметров классической математической статистики установлено, что метод максимального правдоподобия, как правило, лучше (в смысле асимптотической дисперсии асимптотического среднего квадрата ошибки), чем метод моментов. Однако в интервальной статистике это, вообще говоря, не так, что продемонстрировано выше на примере оценивания параметров гамма-распределения. Сравним эти два метода оценивания в случае интервальных данных в общей постановке. Поскольку метод максимального правдоподобия – частный случай метода минимального контраста, начнем с разбора этого несколько более общего метода. Оценки минимального контраста. Пусть Х – пространство, в котором лежат независимые одинаково распределенные случайные элементы Если множество Оценками минимального контраста являются, в частности, многие робастные статистики [3,36]. Эти оценки широко используются в статистике объектов нечисловой природы [3,27], поскольку при Пусть в Х имеется мера то оценка минимального контраста переходит в оценку максимального правдоподобия. Асимптотическое поведение оценок минимального контраста в случае пространств Х и В рассматриваемой математической модели предполагается, что статистику известны лишь искаженные значения Будем изучать величину Пусть при всех
где Используя обозначения векторов x = (x1 , x2 , ..., xn ), y = (y1 , y2 , ..., yn ), введем суммы Аналогичным образом введем функции B0(y), B1(y), R(y), в которых вместо xi стоят yi, i=1,2,…,n. Поскольку в соответствии с теоремой Ферма оценка минимального контраста
то, подставляя в (27) xi вместо x и суммируя по i = 1,2,…,n, получаем, что
откуда
Решения уравнения (28) будем также называть оценками минимального контраста. Хотя уравнение (28) – лишь необходимое условие минимума, такое словоупотребление не будет вызывать трудностей. Теорема 1. Пусть для любого x выполнено соотношение (27). Пусть для случайной величины х1 с распределением, соответствующим значению параметра
Тогда существуют оценки минимального контраста Доказательство. Возьмем Тогда с вероятностью не менее
При (см. формулу (29)). С вероятностью не менее Если Теорема 2. Пусть выполнены условия теоремы 2 и, кроме того, для случайной величины х1, распределение которой соответствует значению параметра Тогда оценка минимального контраста имеет асимптотически нормальное распределение:
для любого х, где Ф(x) – функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Доказательство. Из центральной предельной теоремы вытекает, что числитель в правой части формулы (30) асимптотически нормален с математическим ожиданием 0 и дисперсией Нотна оценки минимального контраста. Аналогично (30) нетрудно получить, что
Следовательно, Покажем, что при
Поскольку
Можно сказать, что наличие погрешностей В правой части (36) первое слагаемое – квадрат асимптотической нотны, второе соответствует статистической ошибке. Приравнивая их, получаем рациональный объем выборки Остается доказать соотношение (35) и вычислить С. Укажем сначала условия, при которых Теорема 3. Пусть существуют константа
при всех x. Пусть для случайной величины х1, распределение которой соответствует Доказательство проведем по схеме доказательства теоремы 1. Из неравенств (37) вытекает, что
Возьмем
Тогда с вероятностью не менее
В силу (38) при этом Пусть Тогда с вероятностью не менее Завершается доказательство дословным повторением такового в теореме 1, с единственным отличием – заменой в обозначениях x на y. Теорема 4. Пусть выполнены условия теоремы 3 и, кроме того, существуют математические ожидания (при
Тогда выполнено соотношение (35) с
Доказательство. Воспользуемся следующим элементарным соотношением. Пусть a и b – бесконечно малые по сравнению с Z и B соответственно. Тогда с точностью до бесконечно малых более высокого порядка Чтобы применить это соотношение к анализу
При с точностью до бесконечно малых более высокого порядка, где Ясно, что задача оптимизации
имеет решение при этом максимальное значение линейной формы есть
С целью упрощения правой части (42) воспользуемся тем, что
где по вероятности, то второе слагаемое в (43) сходится к 0, а первое в силу закона больших чисел с учетом (39) сходится к СА2, где С определено в (40). Теорема 4 доказана. Оценки метода моментов. Пусть Оценки метода моментов имеют вид (функции g и hj должны удовлетворять некоторым дополнительным условиям [39, с.80], которые здесь не приводим). Очевидно, что
с точностью до бесконечно малых более высокого порядка, а потому с той же точностью
Теорема 5. Пусть при функция g дважды непрерывно дифференцируема в некоторой окрестности точки причем Mt(x1) существует. Тогда с точностью до бесконечно малых более высокого порядка, причем Доказательство теоремы 5 сводится к обоснованию проведенных ранее рассуждений, позволивших получить формулу (45). В условиях теоремы 5 собраны предположения, достаточные для такого обоснования. Так, условие (46) дает возможность обосновать соотношения (44); существование Полученные в теоремах 4 и 5 нотны оценок минимального контраста и метода моментов, асимптотические дисперсии этих оценок (см. теорему 2 и [40] соответственно) позволяют находить рациональные объемы выборок, строить доверительные интервалы с учетом погрешностей измерений, а также сравнивать оценки по среднему квадрату ошибки (36). Подобное сравнение было проведено для оценок максимального правдоподобия и метода моментов параметров гамма-распределения. Установлено, что классический вывод о преимуществе оценок максимального правдоподобия [33, с.99-100] неверен в случае
|