Как найти систематическую погрешность: Систематическая погрешность • Физика элементарных частиц • LHC на «Элементах»

Содержание

Систематическая погрешность • Физика элементарных частиц • LHC на «Элементах»

Систематическая погрешность (или, на физическом жаргоне, систематика) характеризует неточность измерительного инструмента или метода обработки данных. Если точнее, то она показывает наше ограниченное знание этой неточности: ведь если инструмент «врет», но мы хорошо знаем, насколько именно, то мы сможем скорректировать его показания и устранить инструментальную неопределенность результата. Слово «систематическая» означает, что вы можете повторять какое-то измерение на этой установке миллионы раз, но если у нее «сбит прицел», то вы систематически будете получать значение, отличающееся от истинного.

Конечно, систематические погрешности хочется взять под контроль. Поскольку это чисто инструментальный эффект, ответственность за это целиком лежит на экспериментаторах, собиравших, настраивавших и работающих на этой установке. Они прилагают все усилия для того, чтобы, во-первых, корректно определить эти погрешности, а во-вторых, их минимизировать. Собственно, они этим начинают заниматься с самых первых дней работы установки, даже когда еще собственно научная программа исследований и не началась.

Возможные источники систематических погрешностей

Современный коллайдерный эксперимент очень сложен. В нём есть место огромному количеству источников систематических погрешностей на самых разных стадиях получения экспериментального результата. Вот некоторые из них.

Погрешности могут возникать на уровне «железа», при получении сырых данных:

  • дефектные или неработающие отдельные регистрирующие компоненты или считывающие элементы. В детекторе миллионы отдельных компонентов, и даже если 1% из них оказался дефектным, это может ухудшить «зоркость» детектора и четкость регистрации сигналов. Надо подчеркнуть, что, даже если при запуске детектор работает на все 100%, постоянное детектирование частиц (это же жесткая радиация!) с течением времени выводит из строя отдельные компоненты, так что следить за поведением детектора абсолютно необходимо;
  • наличие «слепых зон» детектора; например, если частица вылетает близко к оси пучков, то она улетит в трубу и детектор ее просто не заметит.

Погрешности могут возникать на этапе распознавания сырых данных и их превращение в физическое событие:

  • погрешность при измерении энергии частиц в калориметре;
  • погрешность при измерении траектории частиц в трековых детекторах, из-за которой неточно измеряется точка вылета и импульс частицы;
  • неправильная идентификация типа частицы (например, система неудачно распознала след от π-мезона и приняла его за K-мезон). Более тонкий вариант: неправильное объединение адронов в одну адронную струю и неправильная оценка ее энергии;
  • неправильный подсчет числа частиц (две частицы случайно вылетели так близко друг к другу, что детектор «увидел» только один след и посчитал их за одну).

Наконец, новые систематические погрешности добавляются на этапе позднего анализа события:

  • неточность в измерении светимости пучков, которая влияет на пересчет числа событий в сечение процесса;
  • наличие посторонних процессов рождения частиц, которые отличаются с физической точки зрения, но, к сожалению, выглядят для детектора одинаковыми. Такие процессы порождают неустранимый фон, который часто мешает разглядеть искомый эффект;
  • необходимость моделировать процессы (в особенности, адронизацию, превращение кварков в адроны), опираясь частично на теорию, частично на прошлые эксперименты. Несовершенство того и другого привносит неточности и в новый экспериментальный результат. По этой причине теоретическую погрешность тоже часто относят к систематике.

В отдельных случаях встречаются источники систематических погрешностей, которые умудряются попасть сразу во все категории, они совмещают в себе и свойства детекторного «железа», и методы обработки и интерпретации данных. Например, если вы хотите сравнить друг с другом количество рожденных частиц и античастиц какого-то сорта (например, мюонов и антимюонов), то вам не стоит забывать, что ваш детектор состоит из вещества, а не из антивещества! Этот «перекос» в сторону вещества может привести к тому, что детектор будет видеть мюонов меньше, чем антимюонов, подробности см.

в заметке Немножко про CP-нарушение, или Как жаль, что у нас нет детекторов из антивещества!.

Всю эту прорву источников потенциальных проблем надо распознать и оценить их влияние на выполняемый анализ. Здесь никаких абсолютно универсальных алгоритмов нет; исследователь должен сам понять, на какие погрешности надо обращать внимание и как грамотно их оценить. Конечно, тут на помощь приходят разные калибровочные измерения, выполненные в первые год-два работы детектора, и программы моделирования, которые позволяют виртуально протестировать поведение детектора в тех или иных условиях. Но главным в этом искусстве всё же является физическое чутье экспериментатора, его квалификация и накопленный опыт.

Почему важна грамотная оценка систематики

Беспечная оценка систематических погрешностей может привести к двум крайностям, причем обе очень нежелательны.

Заниженная погрешность — то есть неоправданная уверенность экспериментатора в том, что погрешности в его детекторе маленькие, хотя они на самом деле намного больше, — исключительно опасна, поскольку она может привести к совершенно неправильным научным выводам. Например, экспериментатор может на их основании решить, что измерения отличаются от теоретических предсказаний на уровне статистической значимости 10 стандартных отклонений (сенсация!), хотя истинная причина расхождения может просто состоять в том, что он проглядел источник ошибок, в 10 раз увеличивающий неопределенность измерения, и никакого расхождения на самом деле нет.

В борьбе с этой опасностью есть соблазн впасть в другую крайность: «А вдруг там есть еще какие-то погрешности? Может, я что-то не учел? Давай-ка я на всякий случай увеличу погрешности измерения в 10 раз для пущей безопасности.» Такая крайность плоха тем, что она обессмысливает измерение. Неоправданно завышая погрешность, вы рискуете получить результат, который будет, конечно, правильным, но очень неопределенным, ничем не лучше тех результатов, которые уже были получены до вас на гораздо более скромных установках. Такой подход, фактически, перечеркивает всю работу по разработке технологий, по изготовлению компонентов, по сборке детектора, все затраты на его работу и на анализ результатов.

Грамотный и ответственный анализ систематики должен удерживать оптимальный баланс (максимальная достоверность при максимальной научной ценности), не допуская таких крайностей. Это очень тонкая и сложная работа, и первые страницы в большинстве современных экспериментальных статей по физике частиц посвящены тщательному обсуждению систематических (а также статистических) погрешностей.

Мы не будем обсуждать подробности того, как обсчитывать систематические погрешности. Подчеркнем только, что это серьезная наука с множеством тонкостей и подводных камней. В качестве примера умеренно простого обсуждения некоторых вопросов см. статью Systematic Errors: facts and fictions.

Белорусский государственный университет транспорта – БелГУТ (БИИЖТ)

Регистрация на конференцию «Проблемы безопасности на транспорте»

Регистрация на конференцию «Тихомировские чтения»

Как поступить в БелГУТ:


дневное, заочное полное,
заочное сокращенное

Как получить место


в общежитии БелГУТа

Как поступить иностранному гражданину

События

Все события

Пн Вт Ср Чт Пт Сб Вс

1

Дата : 2022-09-01

2

3

4

5

Дата : 2022-09-05

6

Дата : 2022-09-06

7

Дата : 2022-09-07

8

Дата : 2022-09-08

9

Дата : 2022-09-09

10

Дата : 2022-09-10

11

Дата : 2022-09-11

12

13

14

15

Дата : 2022-09-15

16

Дата : 2022-09-16

17

Дата : 2022-09-17

18

19

20

21

Дата : 2022-09-21

22

Дата : 2022-09-22

23

24

25

26

27

28

29

30

Все анонсы

  • Экспозиции, посвященные Грунтову П.
    С. и Белому В.А…
  • Турнир на джойстиках по игре в MORTAL COMBAT IX…
  • С Днем народного единства!
  • Студсовет поздравляет с Днем народного единства…
  • Заседание совета университета…
  • Молодёжный сентябрь
  • Конкурс кандидатов в перспективный кадровый резерв…
  • Велопробег «В единстве – сила»…
  • Логистика. Обучение для студентов выпускных курсов…
  • Акция «Мы едины» – поем гимн вместе…

Анонсы

Университет

Абитуриентам

Студентам

Конференции

Приглашения

Экспозиции, посвященные Грунтову П.С. и Белому В.А…

Турнир на джойстиках по игре в MORTAL COMBAT IX…

С Днем народного единства!

Студсовет поздравляет с Днем народного единства…

Новости

Университет

Международные связи

Спорт

Воспитательная работа

Жизнь студентов

Новости подразделений



  • Университет

Заседание Совета ветеранов, актива БРСМ и Студсовета. ..
20 сентября 2022

  • Спорт

Победа в соревнованиях по пляжному волейболу…
20 сентября 2022

  • Воспитательная работа

Лекция по профилактике суицида и пропаганде ценности жизни…
19 сентября 2022

  • Воспитательная работа

Патриотический форум «Это НАША история!»…
19 сентября 2022

  • Университет

Челлендж «Рукопожатие» в День народного единства…
19 сентября 2022

  • Университет

Студенческий совет на праздничном концерте…
18 сентября 2022

  • Спорт

В единстве – сила! Велопробег
17 сентября 2022

  • Студенческая жизнь

Белорусский Студенческий патриотический форум, приуроченный ко Дню нар. ..
17 сентября 2022

  • Студенческая жизнь

Выставка военной атрибутики
16 сентября 2022

Другие новости

  • Матч по мини-футболу между БелГУТом и ГГТУ…
  • Исполняем гимн вместе
  • Диалоговая площадка «Беларусь адзіная»…
  • Мероприятие «День народного единства – праздник всей страны» в студенч…
  • Квиз «Гісторыя майго жыцця»
  • Флэшмоб «Мы едины»
  • Встреча секретаря БРСМ БелГУТа со студентами…
  • Встреча ректора со студентами в студенческом городке…
  • Проект студента востребован в городе
  • Будущее Беларуси – в единстве
  • Видео-репортаж Дня рождения Гомеля

КУДА ПОСТУПАТЬ

Все факультеты

БелГУТ на Доске почета

Достижения университета

Предложения

Все предложения

Видеотека

Все видео

Фотогалерея

Все фото

ПОГРЕШНОСТИ ИЗМЕРЕНИЙ

ПОГРЕШНОСТИ ИЗМЕРЕНИЙ

Как выполнить и оформить лабораторную работу

Общие указания

  • подготовка к работе

  • выполнение работы

  • оформление отчета

Погрешности измерений

О численных расчетах

Правила построения графиков

 

В лабораторном практикуме студенты вначале знакомятся с основными приемами проведения физических измерений и правилами обработки результатов. При этом должны быть выработаны определенные навыки, что является предпосылкой дальнейшей успешной работы в лаборатории. Целью лабораторного практикума является более глубокое осознание студентами физических явлений и законов. Эта задача может быть успешно решена только в том случае, если лабораторные работы выполняются с достаточным пониманием сущности исследуемых явлений. Поэтому домашняя подготовка к выполнению лабораторной работы является одним из важнейших этапов.

Подготовка к работе. При подготовке к работе рекомендуется придерживаться следующего плана.

  1. Прочитайте название работы и выясните смысл всех непонятных слов.
  2. Прочитайте описание работы от начала до конца, не задерживаясь на выводе формул. Задача первого прочтения состоит в том, чтобы выяснить, какой физический закон или явление изучается в данной работе и каким методом проводится исследование.
  3. Прочитайте по учебнику материал, относящийся к данной работе. Разберите вывод формул по методическому пособию. Найдите ответы на контрольные вопросы, приведенные в конце описания работы.
  4. Разберите по методическому пособию принцип устройства и работы приборов, которые предполагается использовать в работе.
  5. Выясните, какие физические величины и с какой точностью будут непосредственно измеряться и каковы их размерности.
  6. Начертите в лабораторном журнале принципиальную схему эксперимента и таблицы, в которые будут заноситься результаты измерений.
  7. Продумайте, какой окончательный результат должен быть получен в данной лабораторной работе.

Выполнение работы. При выполнении работы вначале следует ознакомиться с приборами. Нужно установить их соответствие описанию, выполнить рекомендованную в описании прибора последовательность действий по подготовке прибора к работе, убедиться в том, что при изменении положений органов управления возникают ожидаемые изменения параметров, определить цену деления шкалы прибора и его систематическую погрешность, выяснить, как изменить множитель шкалы (если это возможно), попробовать сделать пробный отсчет. Далее следует провести предварительный опыт с тем, чтобы пронаблюдать качественно изучаемое явление, оценить, в каких пределах находятся измеряемые величины. После проведенной подготовки можно приступать к измерениям. Следует помнить, что всякое измерение, если только это возможно сделать, должно выполняться больше, чем один раз.

Производимые по приборам отсчеты записываются в лабораторный журнал сразу же после выполнения отсчета в том виде как они считаны со шкалы прибора – без каких-либо пересчетов на множитель шкалы или систему единиц. Естественно, что единицы измерений и множитель шкалы должны быть записаны в заголовке соответствующей таблицы с результатами измерений. При измерениях, выполняемых при помощи осциллографа, отсчет следует делать непосредственно по шкале осциллографа, установив предварительно подходящий размер изображения. Картинка, срисованная с экрана, может быть использована только в качестве иллюстрации или для качественного анализа. Все записи при выполнении лабораторной работы должны вестись исключительно в лабораторном журнале. Лабораторный журнал является одновременно и черновиком, и чистовиком. Его следует вести самым аккуратнейшим образом. Здесь и только здесь производятся все записи при выполнении лабораторной работы, в том числе прикидочные расчеты и предварительные результаты. Все исправления в журнале должны делаться так, чтобы предыдущий результат оставался читаемым. Рядом с исправлением следует указывать, в чем состоит причина исправления. Лабораторный журнал является тем единственным документом, на основании которого затем делается отчет о выполненной работе. Поэтому журнал следует приносить на все занятия, как при выполнении работы, так и при сдаче отчета.

Оформление отчета. На титульном листе отчета указывается название работы и фамилия автора отчета. В начале отчета формулируется цель работы и/или физический закон (явление), исследованный в работе. Обязательно приводится схема установки (не рисунок!), на которой выполнялась работа. В механике- это кинематическая схема, на которой видны все перемещения частей устройства, в электричестве- принципиальная схема, в оптике- схема расположения оптических элементов и ход лучей и т. д. В соответствующих таблицах приводятся результаты непосредственных измерений, причем все таблицы должны быть озаглавлены (например, “Таблица 1. Результаты измерения массы тела студента до и после обеда”). Приводятся все расчетные формулы (без вывода) как в символьном виде, так и с подставленными числами. Приводится вывод формул для расчета погрешностей и сам расчет. В конце каждого упражнения записывается окончательный результат, полученный в данном упражнении. К отчету прикладываются необходимые графики. На каждом графике должно быть указано, к какому упражнению он относится, и что на графике изображено. В конце отчета формулируются выводы. В выводах должны быть проанализированы полученные результаты и дано заключение об их согласии с теоретическими зависимостями.

ПОГРЕШНОСТИ ИЗМЕРЕНИЙ

Основной задачей физического эксперимента является измерение численных значений наблюдаемых физических величин. Измерением называется операция сравнения величины исследуемого объекта с величиной единичного объекта. Так, например, за единицу длины принят метр, и в результате измерения длины некоторого отрезка определяется, сколько метров содержится в этом отрезке.

Принято различать прямые и косвенные измерения. При прямом измерении производится непосредственное сравнение величины измеряемого объекта с величиной единичного объекта. В результате искомая величина находится прямо по показаниям измерительного прибора, например, сила тока – по отклонению стрелки амперметра, вес – по растяжению пружинных весов и т.д. Однако гораздо чаще измерения проводят косвенно, например, площадь прямоугольника определяют по измерению длин его сторон, электрическое сопротивление – по измерениям силы тока и напряжения и т.д. Во всех этих случаях искомое значение измеряемой величины получается путем соответствующих расчетов.

Результат всякого измерения всегда содержит некоторую погрешность. Поэтому в задачу измерений входит не только нахождение самой величины, но также и оценка допущенной при измерении погрешности. Напомним, что абсолютной погрешностью приближенного числа называется разность между этим числом и его точным значением, причем ни точное значение, ни абсолютная погрешность принципиально неизвестны и подлежат оценке по результатам измерений. Относительной погрешностью приближенного числа называется отношение абсолютной погрешности приближенного числа к самому этому числу. Если оценка погрешности результата физического измерения не сделана, то можно считать, что измеряемая величина вообще неизвестна, поскольку погрешность может, вообще говоря, быть того же порядка, что и сама измеряемая величина или даже больше. В этом состоит отличие физических измерений от бытовых или технических, в которых в результате практического опыта заранее известно, что выбранный измерительный инструмент обеспечивает приемлемую точность, а влияние случайных факторов на результат измерений пренебрежимо мало по сравнению с ценой деления применяемого прибора.

Погрешности физических измерений принято подразделять на систематические, случайные и грубые. Систематические погрешности вызываются факторами, действующими одинаковым образом при многократном повторении одних и тех же измерений. Систематические погрешности скрыты в неточности самого инструмента и неучтенных факторах при разработке метода измерений. Обычно величина систематической погрешности прибора указывается в его техническом паспорте. Что же касается метода измерений, то здесь все зависит от квалификации экспериментатора. Хотя суммарная систематическая погрешность во всех измерениях, проводимых в рамках данного эксперимента, будет приводить всегда либо к увеличению, либо к уменьшению правильного результата, знак этой погрешности неизвестен. Поэтому на эту погрешность нельзя внести поправку, а приходится приписывать эту погрешность окончательному результату измерений.

Случайные погрешности обязаны своим происхождением ряду причин, действие которых неодинаково в каждом опыте и не может быть учтено. Они имеют различные значения даже для измерений, выполненных одинаковым образом, то есть носят случайный характер. Допустим, что сделано n повторных измерений одной и той же величины. Если они выполнены одним и тем же методом, в одинаковых условиях и с одинаковой степенью тщательности, то такие измерения называются равноточными.

Пусть минимальный интервал значений измеряемой величины, через который ведутся отсчеты (цена деления прибора), будет h, а среднее арифметическое всех результатов измерений пусть будет < x> . Обозначим через ki число тех результатов, которые отклонились от среднего < x> на величину Δx= ih. Отложив по оси абсцисс величину абсолютных погрешностей Δx, а по оси ординат значения k, получим ступенчатый график, называемый гистограммой (рис.1).

Если устремить число измерений к бесконечности, а интервал h к нулю, то гистограмма переходит в пределе в непрерывную кривую, которая является кривой распределения погрешностей. При некоторых условиях, которые обычно выполняются при проведении измерений, эта кривая представляет собой график функции Гаусса, имеющей следующий вид:

Рис. 2

(1)

где параметр σ определяет ширину распределения. Несколько кривых Гаусса для разных значений параметра σ показаны на рис.2.

Третий тип погрешностей, с которыми приходится иметь дело – грубые погрешности или промахи. Под грубой погрешностью измерения понимается погрешность, существенно превышающая ожидаемую при данных условиях. Она может быть сделана вследствие неправильного применения прибора, неверной записи показаний прибора, ошибочно прочитанного отсчета, неучета множителя шкалы и т.п.

Вычисление погрешностей. В дальнейшем будем предполагать, что

1) грубые погрешности исключены;

2) поправки, которые следовало определить (например, смещение нулевого деления шкалы), вычислены и внесены в окончательные результаты;

3) все систематические погрешности известны (с точностью до знака).

В этом случае результаты измерений оказываются все же не свободными от случайных погрешностей. Если случайная погрешность окажется меньше систематической, то, очевидно, нет смысла пытаться уменьшить величину случайной погрешности – все равно результаты измерений не станут значительно лучше и, желая получить большую точность, нужно искать пути к уменьшению систематической погрешности. Наоборот, если случайная погрешность больше систематической, то именно случайную погрешность нужно уменьшить в первую очередь и добиться того, чтобы случайная погрешность стала меньше систематической, с тем чтобы последняя опять определяла окончательную погрешность результата. На практике обычно уменьшают случайную погрешность до тех пор, пока она не станет сравнимой по величине с систематической погрешностью. Как будет видно из дальнейшего, случайная погрешность уменьшается при увеличении числа измерений.

Поскольку из-за наличия случайных погрешностей результаты измерений по своей природе представляют собой тоже случайные величины, истинного значения xист измеряемой величины указать нельзя. Однако можно установить некоторый интервал значений измеряемой величины вблизи полученного в результате измерений значения xизм, в котором с определенной вероятностью содержится xист. Тогда результат измерений можно представить в следующем виде:

(2)

где Δxпогрешность измерений. Вследствие случайного характера погрешности точно определить ее величину невозможно. В противном случае найденную погрешность можно было бы ввести в результат измерения в качестве поправки и получить истинное значение xист.. Задача наилучшей оценки значения xист и определения пределов интервала (2) по результатам измерений является предметом математической статистики. Воспользуемся некоторыми ее результатами.

Пусть проведено n измерений величины x. Тогда за лучшую оценку истинного значения результата измерений принимается среднее арифметическое значение

(3)

где xi – результат i -го измерения.

Для оценки случайной погрешности измерения существует несколько способов. Наиболее распространена оценка с помощью стандартной или средней квадратичной погрешности σ (ее часто называют стандартной погрешностью или стандартом измерений).

Средней квадратичной погрешностью называется величина

(4)

где n – число наблюдений.

Если число наблюдений очень велико, то подверженная случайным колебаниям величина Snстремится к постоянному значению σ:

.

Именно этот предел и входит в качестве параметра σ в распределение Гаусса (1). Квадрат этой величины называется дисперсией измерений. В действительности, по результатам измерений всегда вычисляется не σ , а ее приближенное значение Sn, которое, вообще говоря, тем ближе к σ, чем больше n.

Все сказанное выше о погрешностях относится к погрешностям отдельного измерения. Однако важнее знать, насколько может уклоняться от истинного значения x среднее арифметическое < x> , полученное по формуле (3) для n повторных равноточных измерений. Теория показывает, что средняя квадратичная погрешность среднего арифметического S равна средней квадратичной погрешности отдельного результата измерений Sn, деленной на корень квадратный из числа измерений n, то есть

(5)

Это фундаментальный закон возрастания точности при росте числа наблюдений.

Пусть α означает вероятность того, что результат измерений отличается от истинного на величину, не большую, чем Δx. Вероятность α в этом случае носит название доверительной вероятности, а интервал значений измеряемой величины oт < x> Δx до < x> x называется доверительным интервалом.

Определим доверительный интервал. Чем большим будет установлен этот интервал, тем с большей вероятностью xистпопадаетв этот интервал. С другой стороны, более широкий интервал дает меньшую информацию относительно величины xист. Если ограничиться учетом только случайных погрешностей, то при небольшом числе измерений n для уровня доверительной вероятности a полуширина доверительного интервала (2) равна

(6)

где tα,n– коэффициент Стьюдента.

Таблица 1.

Коэффициенты Стьюдента.

α =0,68

α =0,95

α =0,99

n

tα ,n

n

tα ,n

n

tα ,n

2 2,0 2 12,7 2 63,7
3 1,3 3 4,3 3 9,9
4 1,3 4 3,2 4 5,8
5 1,2 5 2,8 5 4,6
6 1,2 6 2,6 6 4,0
7 1,1 7 2,4 7 3,7
8 1,1 8 2,4 8 3,5
9 1,1 9 2,3 9 3,4
10 1,1 10 2,3 10 3,3
15 1,1 15 2,1 15 3,0
20 1,1 20 2,1 20 2,9
30 1,1 30 2,0 30 2,8
100 1,0 100 2,0 100 2,6
Смысл понятий “доверительный интервал” и “доверительная вероятность” состоит в следующем: пусть α =0. 95, тогда можно утверждать с надежностью 95%, что истинное значение величины xист не отличается от оценки (3) больше, чем на ±Δxсл.Значения коэффициентов tα ,n в зависимости от α и n табулированы (см. табл. Чтобы окончательно установить границы доверительного интервала необходимо расширить его с учетом систематической погрешности Δxсист. Систематическая погрешность, как правило, указана в паспорте или на шкале прибора, а в простейших случаях может быть принята равной половине цены деления младшего разряда шкалы. Обычно (хотя, строго говоря, и неверно) суммарная погрешность определяется как корень квадратный из суммы квадратов случайной и систематической погрешностей:
(7)

Определенная согласно (7) величина Δx является абсолютной погрешностью. Очевидно, что при одном и том же значении Δx результат может оказаться достаточно точным при измерении некоторой большой величины, тогда как при измерении малой величины его точность будет недостаточной. Например, пусть имеется возможность измерять линейные размеры с погрешностью Δx=1 мм. Ясно, что это заведомо превышает необходимую точность при измерении, скажем, размеров комнаты, но измерение окажется слишком грубым при определении толщины монеты. Таким образом, становится понятной необходимость введения относительной погрешности, которая определяется как

(8)

и выражается, обычно, в процентах. Как видно, выражение (8) позволяет оценить величину погрешности по отношению к самой измеряемой величине. Очевидно, что в тех случаях, когда измеряемая величина представляет собой условное число, например, астрономическое время в данный момент (но не интервал времени между двумя событиями), пространственная координата (но не расстояние между двумя точками) и т. п., определение относительной погрешности смысла не имеет. Действительно, точность определения текущего времени по одним и тем же часам одинакова и в 12 часов, и в 1 час.

Рассмотрим теперь случай, когда при повторении измерений в одних и тех же условиях устойчиво получаются одинаковые значения x=x0. В этом случае систематическая погрешность настолько превышает случайную, что влияние случайной погрешности полностью маскируется. Истинное значение x отнюдь не равно x0. Оно, по-прежнему, остается неизвестным, и для него можно записать x=x0±Δx, причем погрешность Δx определяется в данном случае воспроизводящимися от опыта к опыту ошибками, связанными с неточностью измерительных приборов или метода измерений. Такую погрешность Δx, как отмечалось, называют систематической. Для более точного определения физической величины x в данном случае необходимо изменить постановку самого опыта: взять прибор более высокого класса точности, улучшить методику измерений и т. п.

Класс точности прибора (приведенная погрешность) – это выраженная в процентах относительная погрешность, которую дает данный прибор при измерении им наибольшего значения измеряемой величины, указанной на шкале прибора. Тогда абсолютная погрешность оказывается одинаковой по всей шкале прибора. Например, пусть имеется амперметр класса 1,5 со шкалой 20 А. При измерении им любого значения тока абсолютная погрешность будет равна 0,015·20 = 0,3 А. Нетрудно видеть, что при измерениях в конце шкалы относительная погрешность оказывается меньше, приближаясь к приведенной. Класс точности обычно указывается на шкале прибора соответствующей цифрой. Если на шкале такого обозначения нет, то данный прибор внеклассный, и его приведенная погрешность более 4%.

Рассмотрим, каким образом оценить случайную погрешность косвенно измеряемой величины y, которая является функцией некоторого числа m непосредственно измеряемых величин xi, т.е.

(9)

Само среднее значение <y> можно найти из известной функциональной зависимости (9), подставляя в качестве аргументов усредненные по всем проведенным опытам значения непосредственно измеренных величин < xi> . Соответствующие вычисления показывают, что абсолютная погрешность Δy в этом случае определяется по формуле

(10)

где обозначает так называемую частную производную.

Частная производная – это такая производная, которая вычисляется от функции f по аргументу xi , притом как все остальные аргументы считаются постоянными.

Относительная погрешность для косвенно измеряемой величины y определяется как

(11)

Формулу (10) применяют в тех случаях, когда в зависимости (9) измеряемые величины xiвходят, в основном, в виде слагаемых, а формула (11) оказывается особенно удобной тогда, когда правая часть (9) представляет собой произведение величин xi . Учитывая простую связь между абсолютной и относительной погрешностями δ =Δy/< y> , легко по известной величине Δy вычислить δ и наоборот. Рассмотрим применение формул (10) и (11) на примере. Пусть функциональная зависимость косвенно измеряемой величины y от непосредственно измеряемых величин xi имеет следующий простой вид:

.

Поскольку функция y представляет собой сумму двух слагаемых, находим частные производные

и подставляем их в формулу (10):

,

причем абсолютные погрешности Δx1 и Δx2 должны быть предварительно определены, как указано выше, по формулам (4) – (7).

Пусть теперь функциональная зависимость косвенно измеряемой величины y от непосредственно измеряемых величин xi имеет следующий вид:

.

В этом случае для определения погрешности косвенно измеряемой величины y воспользуемся формулой (11). Для этого сначала найдем логарифм, а затем – частные производные:

Подставляя в (11), найдем

.

Нетрудно видеть, что предварительное логарифмирование существенно упростило вид частных производных. Измеряемая величина y, вообще говоря, имеет какую-то размерность. Брать логарифм от размерной величины конечно же нельзя. Чтобы устранить некорректность, достаточно разделить y на постоянную, равную единице данной размерности (если y – длина, то разделим на 1 м). После логарифмирования получится дополнительное слагаемое, которое все равно исчезнет при взятии частных производных (производная от постоянной равна нулю), поэтому наличие такого слагаемого обычно подразумевается.

При обработке результатов измерений предлагается следующий порядок операций.

При прямых (непосредственных) измерениях

1. Вычисляется среднее из n измерений:

.

2. Определяется среднеквадратичная погрешность среднего арифметического:

.

3. Задается доверительная вероятность α и определяется коэффициент Стьюдента tα,n для заданного α и числа произведенных измерений n по табл. 1.

4. Находится полуширина доверительного интервала (абсолютная погрешность результата измерений):

, где Δ xсл = tα,nS.

5. Оценивается относительная погрешность результата измерений

6. Окончательный результат записывается в виде

x=< x> ±Δ x.

При косвенных измерениях

1. Для каждой серии измерений величин, входящих в определение искомой величины, производится обработка в описанной выше последовательности. При этом для всех измеряемых величин задают одно и то же значение доверительной вероятности a .

2. Оценивается точность результата косвенных измерений по формуле (10) либо (11), где производные вычисляются при средних значениях величин.

3. Определяется относительная погрешность результата серии косвенных измерений.

4. Окончательный результат записывается в виде

y=< y> ± Δy, где < y> =f(< x1>, < x2>,. ..,< xm>).

Возможен и другой подход к оценке погрешности результата косвенного измерения. Вместо определения искомой величины через средние значения < xi>как

< y> =f(< x1>, < x2>,…,< xm>)

можно для каждого выполненного опыта вычислить

а затем найти < y> как среднее арифметическое согласно (3) и далее абсолютную погрешность Δy по формулам (4)- (6). Оба способа дают близкие результаты.

О ЧИСЛЕННЫХ РАСЧЕТАХ

При вычислениях на микрокалькуляторе в ответе автоматически получается столько цифр, сколько их вмещается на индикаторе микрокалькулятора. При этом создается впечатление об избыточной точности результата. В то же время результаты измерений являются приближенными числами. Напомним (см., например, М. Я.Выгодский, Справочник по элементарной математике), что для приближенных чисел отличают запись 2,4 от 2,40, запись 0,02 от 0,0200 и т.д. Запись 2,4 означает, что верны только цифры целых и десятых, истинное же значение числа может быть, например, 2,43 или 2,38. Запись 2,40 означает, что верны и сотые доли, истинное число может быть 2,403 или 2,398, но не 2,421 и не 2,382. То же отличие проводится и для целых чисел. Запись 382 означает, что все цифры верны. Если же за последнюю цифру ручаться нельзя, то число округляется, но записывается не в виде 380, а в виде 38·10. Запись же 380 означает, что последняя цифра (ноль) верна. Если в числе 4720 верны лишь первые две цифры, его нужно записать в виде 47·102 или 4,7·103. В тех случаях, когда численные значения физических величин много больше либо много меньше единицы, их принято записывать в виде числа между 1 и 10, умноженного на соответствующую степень десяти.

Число знаков в окончательном результате устанавливается по следующим правилам. Сначала ограничивается число значащих цифр погрешности. Значащими цифрами называются все верные цифры числа кроме нулей, стоящих впереди числа. Например, в числе 0,00385 три значащие цифры, в числе 0,03085 четыре значащие цифры, в числе 2500 – четыре, в числе 2,5·103– две. Погрешность записывается всегда с одной или двумя значащими цифрами. При этом руководствуются следующими соображениями.

Величина случайной погрешности, полученная из обработки результатов некоторого числа измерений, сама является случайным числом, т.е., если проделать это же число измерений еще раз, то, вообще говоря, будет получен не только другой результат для измеряемой величины, но и другая оценка для погрешности. Поскольку погрешность оказывается случайным числом, то, пользуясь законами математической статистики, можно и для нее найти доверительный интервал. Соответствующие расчеты показывают, что даже при довольно большом числе измерений этот доверительный интервал оказывается весьма широким, т. е. величина погрешности оценивается достаточно грубо. Так при 10 измерениях относительная погрешность у погрешности превышает 30%. Поэтому для нее следует приводить две значащие цифры, если первая из них 1 или 2, и одну значащую цифру, если она равна или больше 3. Это правило легко понять, если учесть, что 30% от 2 составляет 0,6, а от 4 уже 1,2. Таким образом, если погрешность выражается, например, числом, начинающимся с цифры 4, то это число содержит неточность (1,2), превышающую единицу первого разряда.

После того, как погрешность записана, значение результата должно быть округлено таким образом, чтобы его последняя значащая цифра была того же разряда, что и у погрешности. Пример правильного представления окончательного результата:

t=(18.7± 1.2)·102с.

ПРАВИЛА ПОСТРОЕНИЯ ГРАФИКОВ

Графики строятся на миллиметровой бумаге, на которую прежде всего наносятся координатные оси. На концах осей указываются откладываемые физические величины и их размерности. Затем на оси наносят масштабные деления так, чтобы расстояние между делениями составляло 1, 2, 5 единиц (или 0.1, 0.2, 0.5, или 10, 20, 50 и т.д.). Обычно порядок масштаба, т.е. 10±nвыносится на конец оси. Например, для пути, пройденного телом, вместо 1000, 1100, 1200 и т.д. метров около масштабных делений пишут 1.0, 1.1, 1.2, а в конце оси физическую величину обозначают как S, 103 м или S·103, м. Точка пересечения осей не обязательно должна соответствовать нулю по каждой из осей. Начало отсчета по осям и масштабы следует выбирать так, чтобы график занял всю координатную плоскость. После построения осей на миллиметровку наносят экспериментальные точки. Их обозначают маленькими кружками, квадратиками и т.д. Если на одной координатной плоскости строится несколько графиков, то для точек выбираются разные обозначения. Затем от каждой точки вверх, вниз и вправо, влево откладывают отрезки, соответствующие погрешностям точек в масштабах осей. Если погрешность по одной из осей (или по обеим осям) оказывается слишком малой, то предполагается, что она отображается на графике размером самой точки.

Экспериментальные точки, как правило, не соединяются между собой ни отрезками прямой, ни произвольной кривой. Вместо этого строится теоретический график той функции (линейной, квадратичной, экспоненциальной, тригонометрической и т.д.), которая отражает проявляющуюся в данном опыте известную или предполагаемую физическую закономерность, выраженную в виде соответствующей формулы. В лабораторном практикуме встречаются два случая: проведение теоретического графика преследует цель извлечения из эксперимента неизвестных параметров функции (тангенса угла наклона прямой, показателя экспоненты и т.д.) либо делается сравнение предсказаний теории с результатами эксперимента.

В первом случае график соответствующей функции проводится “на глаз” так, чтобы он проходил по всем областям погрешности возможно ближе к экспериментальным точкам. Существуют математические методы, позволяющие провести теоретическую кривую через экспериментальные точки в определенном смысле наилучшим образом. При проведении графика “на глаз” рекомендуется пользоваться зрительным ощущением равенства нулю суммы положительных и отрицательных отклонений точек от проводимой кривой.

Во втором случае график строится по результатам расчетов, причем расчетные значения находятся не только для тех точек, которые были получены в опыте, а с некоторым шагом по всей области измерений для получения плавной кривой. Нанесение на миллиметровку результатов расчетов в виде точек является рабочим моментом – после проведения теоретической кривой эти точки с графика убираются. Если в расчетную формулу входит уже определенный (или заранее известный) экспериментальный параметр, то расчеты проводятся как со средним значением параметра, так и с его максимальным и минимальным (в пределах погрешности) значениями. На графике в этом случае изображается кривая, полученная со средним значением параметра, и полоса, ограниченная двумя расчетными кривыми для максимального и минимального значений параметра.

Правила построения графиков рассмотрим на следующем примере. Предположим, что в опыте исследовался закон движения некоторого тела. Тело двигалось прямолинейно, и задачей опыта было измерение расстояния, которое тело проходит за различные промежутки времени. После проведения некоторого числа опытов и обработки результатов измерений были найдены средние значения измеряемых величин и их погрешности. Требуется изобразить результаты опыта, представленные в табл. 2, в виде графика и найти из графика скорость тела, предполагая, что движение равномерное.

Таблица 2. Зависимость пути, пройденного телом, от времени

Номер опыта t,с Dt,с S, см DS, см
1 35. 5 1.0 97 6
2 40.0 1.0 99 9
3 45.0 1.0 108 9
4 50.0 1.0 139 11
5 55.0 1.0 146 12

Последовательность операций

  1. Строим оси координат и устанавливаем на них шкалы, исходя из интервалов изменения измеренных величин. Начало оси абсцисс (время) берем при t=30 с, а начало оси ординат (расстояние) – при S=80 см. Размечаем ось абсцисс с шагом 10 с, а ось ординат с шагом 20 см.
  2. Наносим на координатную плоскость точки, представленные в таблице. Для каждой точки откладываем влево и вправо погрешность Δt в масштабе оси абсцисс, а вверх и вниз – погрешность ΔS в масштабе оси ординат.
  3. Исходя из предположения о равномерном движении, т.е. о линейной зависимости S(t)=v0t, проводим прямую с таким расчетом, чтобы она наилучшим образом проходила через все измеренные точки. При проведении прямой учитываем, что в данном опыте при t=0 путь S=0 независимо от скорости, т.е. согласно теоретической формуле продолжение прямой должно проходить через точку (0,0), которая находится за пределами рабочего участка координатной плоскости. Так как скорость v=dS/dt, а производная геометрически представляется тангенсом угла наклона касательной к графику функции, то для равномерного движения тангенс угла наклона прямой дает скорость v0. Находить из графика следует именно тангенс, т. е. отношение противолежащего катета к прилежащему, взятых в масштабных единицах соответствующих осей. Очевидно, что угол наклона прямой зависит от выбора масштаба на осях. Поэтому измерение угла с последующим определением его тангенса смысла не имеет.
  4. Для оценки погрешности проводим через экспериментальные точки еще две прямые – с максимальным и минимальным наклоном в пределах погрешностей большинства точек и с учетом того, что продолжения этих прямых должны пересекать точку (0,0). Определяем тангенс угла наклона этих прямых и устанавливаем интервал, в пределах которого находится искомая величина (скорость).

Окончательный результат построений показан на рис.3.

Рис. 3

Следует заметить, что графическая обработка опытных данных не столь строга, как аналитическая, зато она проста и наглядна.

В тех случаях, когда диапазон изменений измеряемой величины превышает порядок, при построении графика обычно применяют логарифмический масштаб. Для построения логарифмической шкалы по оси от начальной точки в некотором масштабе откладываются отрезки, равные десятичным логарифмам ряда чисел. Если отложен lga, то около соответствующей точки ставится пометка a. Около начальной точки должна стоять пометка 1 (lg1=0). Таким образом, на логарифмической шкале расстояние от пометки 1 до пометки a равно в выбранном масштабе lga. Так как lg(10a)=1+ lga, то пометки на логарифмической шкале на участке от 10 до 100 будут в точности соответствовать пометкам на участке от 1 до 10. Это же рассуждение может быть проведено и для других участков шкалы. Поэтому, для изображения чисел от 1 до 100 на логарифмической оси требуется увеличить длину оси всего в два раза по сравнению с осью, размеченной от 1 до 10. Пусть, например, на оси длиной 10 см требуется отобразить числа от 1 до 100. Тогда на одну декаду будет приходиться 5 см. Соответственно пометка 2 должна стоять на расстоянии lg2·5=1.5см от начала оси, пометка 3 – на расстоянии lg3·5=2.4 см, а пометка 30 – на расстоянии lg30·5=7.4 см. На рис.4 приведен пример участка оси с логарифмической шкалой.

Рис. 4

РЕКОМЕНДОВАННАЯ ЛИТЕРАТУРА

  1. Зайдель А.Н. Погрешности измерений физических величин. – Л.: Наука, 1985.
  2. Тэйлор Дж. Введение в теорию ошибок. – М.: Мир, 1985.
  3. Руководство к лабораторным занятиям по физике. Под ред. Л.Л.Гольдина. – М.: Наука, 1973

[на главную страницу]



Сайт управляется системой uCoz

Онлайн калькулятор: Оценка погрешности прямых измерений

РаботаИнженерные

Вычисляет погрешность прямых измерений для заданной выборки и доверительного интервала.

Измеряя линей­ные размеры предметов измерительными инстру­ментами : линейкой, штангенциркулем, микрометром, проводя измерения времени секундомером или силы электрического тока или величины напряжения соответствующими электроизмерительными приборами Вы проводите прямые измерения.

Погрешность измерений

Любое измерение проводится с определенной точностью, при этом измеренное значение всегда отличается от истинного, так как инструменты измерения, методики и органы чувств человека несовершенны. Поэтому важную роль играет оценка погрешности измерений, результат измерений с учетом погрешности записывается в виде: X ± ΔX, где ΔX — абсолютная погрешность измерений.

Случайные и систематичес­кие погрешности

Погрешности подразделяются на случайные и систематичес­кие.
Систематические погрешности остаются постоянными или закономерно меняются в процессе измерения. Например неточность прибора, неправильная его регулировка ведет к систематической погрешности. Если причина систематической погрешности известна, то чаще всего такую погрешность можно исключить.
Случайные погрешности вызваны различными случайными факторами, влияющими на точность измерений. Например, при измерении секундомером отрезков времени, случайные погрешности связаны с различным (случайным) временем реакции экспериментатора на события запускающие и останавливающие секундомер. Чтобы уменьшить влияние случайной погрешности необходимо проводить многократное измерение физической величины.
Калькулятор ниже вычисляет случайную погрешность выборки прямых измерений для заданного доверительного интервала. Немного теории можно найти сразу за калькулятором.

Расчет погрешностей непосредственных измерений.

Доверительная вероятность

Измерения
Значение
Записей:

51020501001000

Измерения

Значение

Импортировать данныеОшибка импорта

Данные

Загрузить данные из csv файла

Точность вычисления

Знаков после запятой: 3

Среднее значение

 

Абсолютная погрешность

 

Относительная погрешность в %

 

Коэффициент Стьюдента

 

В большинстве случаев результат измерения подчиняется нормальному закону распределения, поэтому истинное значение измерения будет равно пределу:

В случае ограниченного количества измерений, наиболее близким к истинному будет среднее арифметическое:

Согласно элементарной теории ошибок Гаусса случайную погрешность отдельного измерения характеризует так называемое среднеквадратическое отклонение:
, квадрат этой величины называется дисперсией. При увеличении этой величины возрастает разброс результатов измерений, т. е. увеличивается погрешность.

Для оценки погрешности всей серии измерений, вместо отдельного измерения надо найти среднюю квадратичную погрешность среднего арифметического, характеризующую отклонение от истинного значения искомой величины .
По закону сложения ошибок среднее арифметическое имеет меньшую ошибку, чем результат каждого отдельного измерения. Cред­няя квадратичная погрешность среднего арифметического равна:

Стандартная случайная погрешность Δх равна:
, где — коэффициент Стьюдента для заданной доверительной вероятности и числа степеней свободы k = n-1.
Коэффициент Стьюдента можно получить по таблице или воспользоваться нашим калькулятором для вычисления квантилей распределения Стьюдента: Квантильная функция распределения Стьюдента. Следует иметь в виду, что квантильная функция выдает значения одностороннего критерия Стьюдента. Значение двустороннего квантиля для заданной доверительно вероятности соответствует значению одностороннего квантиля для вероятности:

Ссылка скопирована в буфер обмена

Похожие калькуляторы
  • • Превышение по горизонтальному проложению и углу наклона с учетом погрешности измерений
  • • Системы измерения плоских углов
  • • Выражение площади разными единицами
  • • Единицы измерения энергии
  • • Уравнения прямой, проходящей через две точки в трехмерном пространстве
  • • Раздел: Инженерные ( 100 калькуляторов )

 измерения Инженерные погрешность прямые измерения Статистика Стьюдент Физика Химия

PLANETCALC, Оценка погрешности прямых измерений

Anton2020-11-03 14:19:33

‘; return ret; } }

алгоритм оценки (округления), систематическая и случайная погрешности

  1. Причины возникновения погрешности измерения
  2. Систематическая и случайная погрешности
  3. Определение абсолютной погрешности
  4. Алгоритм оценки абсолютной погрешности в серии прямых измерений
  5. Значащие цифры и правила округления результатов измерений
  6. Примеры

Причины возникновения погрешности измерения

Погрешность измерения – это отклонение измеренного значения величины от её истинного (действительного) значения.

Обычно «истинное» значение неизвестно, и можно только оценить погрешность, приняв в качестве «истинного» среднее значение, полученное в серии измерений. Таким образом, процесс оценки проводится статистическими методами.

Виды погрешности измерений

Причины

Инструментальная погрешность

Определяется погрешностью инструментов и приборов, используемых для измерений (принципом действия, точностью шкалы и т.п.)

Погрешность метода

Определяется несовершенством методов и допущениями в методике.

Теоретическая погрешность

Определяется теоретическими упрощениями, степенью соответствия теоретической модели и реальности.

Погрешность оператора

Определяется субъективным фактором, ошибками экспериментатора.

Систематическая и случайная погрешности

Систематической погрешностью называют погрешность, которая остаётся постоянной или изменяется закономерно во времени при повторных измерениях одной и той же величины.

Систематическая погрешность всегда имеет знак «+» или «-», т.е. говорят о систематическом завышении или занижении результатов измерений.

Систематическую погрешность можно легко определить, если известно эталонное (табличное) значение измеряемой величины. Для других случаев разработаны эффективные статистические методы выявления систематических погрешностей. Причиной систематической погрешности может быть неправильная настройка приборов или неправильная оценка параметров (завышенная или заниженная) в расчётных формулах.

Случайной погрешностью называют погрешность, которая не имеет постоянного значения при повторных измерениях одной и той же величины.

Случайные погрешности неизбежны и всегда присутствуют при измерениях.

Определение абсолютной погрешности

Например:

При пяти взвешиваниях гири с маркировкой 100 г были получены различные значения массы. Если принять маркировку за истинное значение, то получаем следующие значения абсолютной погрешности:

1

2

3

4

5

$m_i,г$

98,4

99,2

98,1

100,3

98,5

$\Delta m_i, г$

1,6

0,8

1,9

0,3

1,5

Граница абсолютной погрешности – это величина h: $ |x-x_{ист}| \le h $

Для оценки границы абсолютной погрешности на практике используются статистические методы. N \Delta x_i $$

Шаг 5. Определяем инструментальную погрешность при измерении как цену деления прибора (инструмента) d.

Шаг 6. Проводим оценку границы абсолютной погрешности серии измерений, выбирая большую из двух величин:

$$ h = max \{d; \Delta x_{cp} \} $$

Шаг 7. Округляем и записываем результаты измерений в виде:

$$ a-h \le x \le a+h или x = a \pm h $$

Значащие цифры и правила округления результатов измерений

Значащими цифрами – называют все верные цифры числа, кроме нулей слева. Результаты измерений записывают только значащими цифрами.

Например:

0,00501 – три значащие цифры 5,0 и 1.

5,01 – три значащие цифры.

5,0100 – пять значащих цифр; такая запись означает, что величина измерена с точностью 0,0001.

Например: если при расчетах по результатам серии измерений получена оценка истинного значения a=1,725, а оценка абсолютной погрешности h = 0,11, то результат записывается так:

$$ a \approx 1,7; h \approx ↑0,2; 1,5 \le x \le 1,9 или x = 1,7 \pm 0,2 $$

Примеры

Пример 1. При измерении температура воды оказалась в пределах от 11,55 ℃ до 11,63 ℃. Какова абсолютная погрешность этих измерений?

По условию $11,55 \le t \le 11,63$. Получаем систему уравнений:

$$ {\left\{ \begin{array}{c} a-h = 11,55 \\ a+h = 11,63 \end{array} \right.} \Rightarrow {\left\{ \begin{array}{c} 2a = 11,55+11,63 = 23,18 \\ 2h = 11,63-11,55 = 0,08 \end{array} \right.} \Rightarrow {\left\{ \begin{array}{c} a = 11,59 \\ h = 0,04\end{array} \right.} $$

$$ t = 11,59 \pm 0,04 ℃ $$

Ответ: 0,04 ℃

Пример 2. По результатам измерений найдите границы измеряемой величины. Инструментальная погрешность d = 0,1.

1

2

3

4

5

6

7

$x_i$

15,3

16,4

15,3

15,8

15,7

16,2

15,9

Находим среднее арифметическое:

$$ a = x_{ср} = \frac{15,3+16,4+ \cdots +15,9}{7} = 15,8 $$

Находим абсолютные погрешности:

$$ \Delta x_i = |x_i-a| $$

1

2

3

4

5

6

7

$ \Delta x_i$

0,5

0,6

0,5

0

0,1

0,4

0,1

Находим среднее арифметическое:

$$ \Delta x_{ср} = \frac{0,5+0,6+ \cdots + 0,1}{7} \approx 0,31 \gt d $$

Выбираем большую величину:

$$ h = max \{d; \Delta x_{ср} \} = max⁡ \{0,1; 0,31\} = 0,31 $$

Округляем по правилам округления по избытку: $h \approx ↑0,4$.

Получаем: x = 15, $8 \pm 0,4$

Границы: $15,4 \le x \le 16,2$

Ответ: $15,4 \le x \le 16,2$

Пример 3*. В первой серии экспериментов было получено значение $x = a \pm 0,3$. Во второй серии экспериментов было получено более точное значение $x = 5,631 \pm 0,001$. Найдите оценку средней a согласно полученным значениям x.

Более точное значение определяет более узкий интервал для x. По условию:

$$ {\left\{ \begin{array}{c} a-0,3 \le x \le a+0,3 \\ 5,630 \le x \le 5,632 \end{array} \right.} \Rightarrow a-0,3 \le 5,630 \le x \le 5,632 \le a+0,3 \Rightarrow $$

$$ \Rightarrow {\left\{ \begin{array}{c} a-0,3 \le 5,630 \\ 5,632 \le a+0,3 \end{array} \right.} \Rightarrow {\left\{ \begin{array}{c} a \le 5,930 \\ 5,332 \le a \end{array} \right.} \Rightarrow 5,332 \le a \le 5,930 $$

Т.к. a получено в серии экспериментов с погрешностью h=0,3, следует округлить полученные границы до десятых:

$$ 5,3 \le a \le 5,9 $$

Ответ: $ 5,3 \le a \le 5,9 $

Рейтинг пользователей

за неделю

  • за неделю
  • один месяц
  • три месяца

        Помогай другим

        Отвечай на вопросы и получай ценные призы каждую неделю

        См. подробности

        Систематические погрешности

         

        Систематическая погрешность q – это составляющая погрешности измерения, которая остаётся постоянной или закономерно изменяется при повторных измерениях.

        К систематическим погрешностям измерений можно отнести те составляющие, для которых можно считать доказанным наличие функциональных связей с вызывающими их аргументами. Для них можно предложить следующее определение: систематическая погрешность – закономерно изменяющаяся составляющая погрешности измерений.

        Формально это записывается в виде

        ,

        где – аргументы, вызывающие систематическую погрешность. Главной особенностьюсистематической погрешности являетсяпринципиальная возможность ее выявления, прогнозирования и однозначной оценки, если удается узнать вид функции и значения аргументов.

        Одной из основных задач обработки результатов эксперимента является выяв­ление, оценка величины и, по возмож­ности, устранение всех систематических погрешностей. Изме­няющиеся систематические погрешности выявляются легче постоянных. Для выявления постоянной систематической погрешности необходимо выполнить измерения хотя бы двумя различными способами или мето­дами. Обнаруженные и оцененные систематические погрешности иск­лючаются из результатов путем введения поправок.

        В зависимости от причин возникновения систематические погрешности подразделяют на следующие виды:

        1. Погрешности метода или модели, которые обычно называют ме­тодическими погрешностями, например: определение плотности вещес­тва без учета имеющихся в нем примесей, использование формул, не совсем точно описывающих явление, и др.

        2. Погрешности воздействия внешних факторов: внешних тепло­вых, радиационных, гравитационных, электрических и магнитных по­лей.

        3. Погрешности, возникающие из-за неточности действий или личных качеств оператора (экспериментатора), называемые субъективными погрешностями.

        4. Инструментальные (приборные, аппаратурные) погрешности, обусловленные схемными, конструктивными и технологическими несовершенствами средств из­мерения, их состоянием в процессе эксплуатации. Например, смещение начала отсчета, неточность градуиров­ки шкалы прибора, использование прибора вне допустимых пределов его эксплуатации, неправильное положение прибора и т. п. За исключением смещения начала отсчета, приборные погрешности относятся к разряду неустранимых погрешностей.

        В общем случае систематическая погрешность обусловлена сум­марным воздействием перечисленных факторов, многие из кото­рых невозможно рассчитать, подавить или выявить в данном экспери­менте. Самым простым способом выявления суммарной систематической погрешности было бы сопоставление результатов измерений, получен­ных с помощью серийного (рабочего) и более точного образцового приборов. Разность результатов измерений даст суммарную система­тическую погрешность, вносимую серийным прибором в результат из­мерения. Однако такой способ выявления систематической погрешнос­ти является слишком дорогим. Поэтому на практике различные составляющие систематической погрешности пытаются устранить с помощью экспериментальных или математических приемов путем введения поправок в результаты наблюдений при условии, что погрешность дан­ного вида по величине и знаку известна. После внесения поправок влияние систематической погрешности данного вида на результат и погрешность измерения устраняется полностью. Если же системати­ческая погрешность неизвестна, но имеет известные границы изменения, то её учитывают в результате измерения.

        В зависимости от характера измерения систематические погрешности подразделяют на элементарные и изменяющиеся по сложному закону.

        Элементарные погрешности можно условно разделить на постоянные, прогрессирующие (прогрессивные) и периодические. Прогрессирующими называют монотонно возрастающие или монотонно убывающие погрешности. Периодические погрешности – погрешности, изменение которых можно описать периодической функцией. Погрешности, изменяющиеся по сложному закону, образуются при объединении нескольких систематических погрешностей.

        Постоянные систематические погрешности представлены в графической форме на рисунке 3.2 а ( , или ), а переменные – на рисунке 3.2 б – е. Простейшие переменные систематические погрешности, которые аппроксимируют графиками без перегибов (монотонно изменяющиеся или прогрессирующие) показаны на рисунке 3.2 бг, а периодические или гармонические погрешности – на рисунке 3.2 е.

        Всем известны “спешащие” и “отстающие” часы, погрешности которых прогрессируют во времени, но мало кто анализирует показания часов за полный оборот стрелки. Если оценивать погрешности, то можно утверждать, что в результате многократного повторения вращения стрелки часов должны проявляться периодические погрешности, обусловленные эксцентриситетом и превращающиеся в нуль при завершении каждого полного оборота.

         
         

         

         

        Рисунок 3. 2 – Виды простейших систематических погрешностей: а – постоянные, б, в – прогрессирующие (линейная и нелинейная), г, д – прогрессирующие нелинейные (предложены варианты аппроксимации прямыми линиями), е – периодические (гармонические).

        Обычно для описания и для аппроксимации систематической погрешности подбирают наиболее простую функцию, например линейную для прогрессирующей погрешности. Такой же упрощенный подход применяют и для аппроксимации гармонической систематической погрешности, которая может быть описана как синусоида, косинусоида, пилообразная либо другая периодическая функция.

        Систематическая погрешность может иметь не только элементарный, но и более сложный характер, который можно аппроксимировать функцией, включающей приведенные простые составляющие.

        Сложная систематическая погрешность, включающая постоянную, прогрессирующую и периодическую составляющую, в общем виде может быть описана выражением

         

        ,

        где – постоянная составляющая сложной систематической погрешности; – соответственно аргументы прогрессирующей и периодической составляющих сложной систематической погрешности.



        Дата добавления: 2020-10-14; просмотров: 241; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ


        Систематические ошибки в исследованиях: определение, примеры

        Что такое систематическая ошибка?

        Систематическая ошибка, как следует из названия, представляет собой постоянную или повторяющуюся ошибку, вызванную неправильным использованием или вообще плохим экспериментальным оборудованием. При систематической ошибке можно ожидать, что результат каждого эксперимента будет отличаться от значения в исходных данных.

        Это также известно как систематическая погрешность, поскольку ошибки скрывают правильный результат, что приводит исследователя к неверным выводам

        В следующих параграфах мы рассмотрим типы систематических ошибок, причины этих ошибок, способы выявления систематических ошибок и способы их предотвращения в ходе исследования.

        Используйте бесплатно: Шаблон формы проверки оборудования

        Типы систематических ошибок

        Существует два типа систематических ошибок: ошибка смещения и ошибка коэффициента масштабирования. Эти два типа систематических ошибок имеют свои отличительные признаки, как будет показано ниже.

        1. Ошибка смещения

        Перед началом эксперимента ваши весы должны быть установлены на ноль пунктов. Ошибка смещения возникает, когда шкала измерения не установлена ​​на ноль до взвешивания предметов.

        Например, если вы знакомы с кухонными весами, вы заметите, что на них есть кнопка с надписью тара. Эта кнопка тары устанавливает весы на ноль, прежде чем вы взвешиваете свой товар на весах. Если эта кнопка тарирования используется неправильно, то все измерения будут иметь ошибку смещения, поскольку ноль не будет начальной точкой значений на шкале измерения.

        Другим названием ошибки смещения является ошибка установки нуля.

        Читать: Смещение исследований: определение, типы + пример , типы + пример Смещение исследований: определение, типы + экзамен

        2. Ошибка масштаба

        Это также известно как как известно как множественные ошибки.

        Ошибка коэффициента масштабирования возникает из-за изменения значения или размера масштаба, которые отличаются от его фактического размера.

        Давайте рассмотрим сценарий, в котором ваши весы постоянно добавляют дополнительные 5% к вашим измерениям. Поэтому, когда вы измеряете значение 10 кг, ваши весы показывают результат 10,5 кг.

        Подразумевается, что из-за того, что весы не показывают исходное значение, которое должно быть равно нулю, при каждой растяжке ваши измерения также будут считываться неправильно. Если шкала увеличится на 1%, ваше чтение также увеличится на 1%. Что делает ошибка коэффициента масштабирования, так это то, что через процент или пропорцию она добавляет или вычитает исходное значение.

        Следует отметить, что систематическая ошибка всегда постоянна. Если при первом измерении он дает значение, скажем, 70 г, и вы решите провести измерение снова, он все равно даст вам то же значение, что и раньше.

        Кроме того, как ошибку смещения, так и ошибку коэффициента масштабирования можно изобразить на графике, чтобы определить, чем они отличаются друг от друга.

        Посмотрите на приведенные ниже графики: черная линия представляет собой результат того, что ваши исследовательские данные равны исходному значению, а синяя линия на графике представляет собой ошибку смещения.

        Ранее мы установили, что ошибка смещения сдвигает значение ваших данных, увеличивая или уменьшая его до постоянного значения. Если вы посмотрите на синюю линию, вы поймете, что она добавила к данным одну дополнительную единицу.

        Второй график с розовой линией представляет ошибку коэффициента масштабирования. Ошибка коэффициента масштабирования сдвигает значение ваших данных пропорционально в том же направлении.

        Здесь все значения сдвигаются пропорционально одинаково, но в разной степени.

        Причины систематических ошибок в исследованиях

        Двумя основными причинами систематических ошибок являются неисправные инструменты или оборудование и неправильное использование инструментов.

        Существуют и другие причины возникновения систематической ошибки в ваших экспериментах, и это могут быть данные исследования, смешение, процедура, которую вы использовали для сбора данных, и даже ваш метод анализа.

        Вкратце мы обсудим две основные причины систематической ошибки, а также рассмотрим еще одну причину, известную как метод анализа.

        • Ошибка исследователя

        Если исследователь невежественен, имеет физические проблемы, которые могут повлиять на исследование, или просто небрежен, это может изменить результат исследования. Предотвращение любой из перечисленных выше черт в качестве исследователя может значительно снизить вероятность ошибок в вашем исследовании.

        • Ошибка прибора

        Систематическая ошибка может произойти, если ваше оборудование неисправно. Несовершенство вашего экспериментального оборудования может изменить ваше исследование и, в конечном счете, его результаты.

        • Метод анализа Ошибка

        Как исследователь, если вы не планируете заранее, как вы будете контролировать свой эксперимент, ваше исследование рискует быть неточным. Поэтому, чтобы уменьшить риск ошибки в вашем исследовании, постарайтесь максимально ограничить число независимых переменных только одной. Чем меньше переменных в анализе, тем больше у вас шансов провести исследование без ошибок.

        Как правило, систематическая ошибка может возникнуть, если вы, как исследователь, неоднократно проводите неправильные измерения, если ваша измерительная лента растянулась от своей начальной точки, возможно, из-за многих лет использования, или если ваши весы показывают ноль, когда контейнер или ваше значение размещены на нем.

        Читать: Шкала опроса: определения, типы + [примеры вопросов]

        Влияние систематической ошибки в исследованиях измерения от исходного значения на тот же процент или ту же пропорцию в том же направлении.

        Следствием этого является то, что изменение измерения не повлияет на вашу надежность. Это связано с тем, что независимо от того, сколько раз вы повторите измерение, вы получите одно и то же значение. Тем не менее, влияние на точность вашего результата. Если вы недостаточно внимательны, чтобы заметить неточность, вы можете сделать неверный вывод или даже применить неверные решения.

        Прочтите: Допустимая погрешность – определение, формула + применение

        Как вы определяете систематические ошибки?

        Вы не можете легко обнаружить систематическую ошибку в своем исследовании. На самом деле вы можете не распознать систематические ошибки даже методом визуализации.

        Вам необходимо использовать статистический анализ, чтобы определить тип ошибки, присутствующей в вашем исследовании, и оценить ошибку. Когда результаты вашего исследования дают желаемый результат, систематической ошибки нет.

        Вы также можете определить систематическую ошибку, сравнив результат вашего анализа со стандартом. Если два результата различаются, то может иметь место систематическая погрешность.

        Вы можете использовать стандартные данные или известные теоретические результаты в качестве эталона для обнаружения и определения систематических ошибок в вашем исследовании.

        Обычно при анализе результатов ваших данных вы можете ожидать, что ваш результат покажет, что исходные данные распределены случайным образом. Однако постоянное увеличение или уменьшение результатов ваших исследовательских данных покажет вам, существует ли систематическая погрешность в ваших данных.

        Как только вы обнаружите какую-либо систематическую ошибку в своем исследовании, примените условие обработки, чтобы исправить ее, и немедленно выполните калибровку.

        Прочтите: Ошибки опроса, которых следует избегать: типы, источники, примеры, смягчение последствий

        Примеры систематических ошибок в исследованиях

        Мы рассмотрим следующие примеры, чтобы лучше понять концепцию систематической ошибки.

        Пример 1:

        Предположим, что некоторые исследователи проводят исследование по снижению веса. В конце исследования исследователи поняли, что весы добавили 15 фунтов к каждому из выборочных данных, а затем пришли к выводу, что их вывод неточен, потому что используемые весы давали неверные показания. Это пример систематической ошибки, потому что ошибка, хотя и постоянная, неточная. Если бы исследователи не осознавали этого несоответствия, они сделали бы неверный вывод.

        Этот пример показывает, как в исследованиях могут возникать систематические ошибки из-за неисправных приборов. Поэтому рекомендуется проводить частую калибровку перед проведением теста.

        Пример второй:

        При измерении температуры в помещении, если ваш термометр и измеряемое помещение находятся в плохом контакте, вы получите неточные показания. Если вы повторите тест, а ваш термометр по-прежнему имеет низкий тепловой контакт с помещением, вы получите постоянные результаты, даже если они будут неточными. Здесь термометр не неисправен, причина ошибки в неправомерном обращении исследователя.

        Эти два примера показывают, что систематическая ошибка может возникать из-за неисправных приборов и неправильного использования приборов. Если вы не получите результат, близкий к истинному значению ваших данных, рассмотрите возможность определения причины ошибки и способов ее уменьшения.

        Как свести к минимуму или избежать систематических ошибок в исследованиях

        Как только вы сможете определить причину систематической ошибки, вы сможете в значительной степени уменьшить ее влияние на ваши данные.

        Проблема, однако, в том, что систематические ошибки нелегко обнаружить. Это связано с тем, что ваше оборудование не может говорить, поэтому вы не получите предупреждающий сигнал, и независимо от того, сколько раз вы проводите тест, вы получите один и тот же результат, который может сбить с толку.

        Так что же делать? Сначала вы должны убедиться, что понимаете свое оборудование и его функции.

        Используйте бесплатно: Шаблон журнала технического обслуживания оборудования

        Это позволит вам узнать ограничения вашего оборудования. Если вы используете вольтметр в цепи, он может давать вам различные показания напряжения в зависимости от того, является ли это напряжением с высоким или низким током.

        Если вы проводите тестирование компьютерной программы, заранее подтвердите, правильно ли работает программа. Вы можете сделать это, проверив данные, значение которых было определено ранее. Таким образом, вы будете уверены в том, каким должен быть результат, поэтому, если вы получите другой результат, вы поймете, что что-то не так.

        Как только вы поймете, в чем проблема, вы сможете уменьшить систематическую ошибку, правильно настроив свое оборудование. Проверьте свое оборудование, прежде чем проводить фактические измерения, и всегда сравнивайте полученные значения со стандартами или теоретическими результатами.

        Часто задаваемые вопросы о систематических ошибках в исследованиях

        • В чем разница между систематической и случайной ошибкой?

        Как следует из названия, случайная ошибка всегда случайна. Вы не можете предсказать это, и вы не можете получить те же показания, если повторите измерение или анализ. Вы всегда будете получать уникальное значение (случайное значение).

        Например, предположим, что вы взвесили мешок с зерном на весах, в первый раз вы можете получить значение 140 фунтов, если вы попытаетесь снова, вы можете прийти к 125 фунтам. Независимо от того, сколько раз вы повторите измерение, вы получите другую или случайную ошибку.

        Систематические ошибки всегда согласуются с ошибкой. Даже если вы повторите процесс, вы все равно получите ту же ошибку.

        Например, если ваши измерения составляют 80 г, а измерительная лента растянута на 99 мм, либо в качестве добавления, либо в качестве вычета, если вы повторите измерение, показание, которое вы получите, будет таким же, как и раньше. Ошибка будет последовательной.

        • Как устранить систематическую ошибку?

        Систематические ошибки можно устранить, используя в своих исследованиях один из этих методов.

        Триангуляция : Это метод использования нескольких методов для документирования ваших исследовательских наблюдений. Таким образом, вы не полагаетесь на одно оборудование или технику. Когда вы закончите тестирование, вы можете легко сравнить результаты нескольких методов и посмотреть, совпадают они или нет.

        Частая калибровка : Это означает, что вы сравниваете результаты теста со стандартным значением или теоретическим результатом. Делая это регулярно со стандартным результатом для перекрестной проверки, вы можете снизить вероятность систематической ошибки в вашем исследовании.

        Когда вы проводите исследования, обязательно проводите плановые проверки. Если вам интересно, как часто вы должны выполнять калибровку, обратите внимание, что это обычно зависит от вашего оборудования.

        Рандомизация: Использование рандомизации в вашем исследовании может снизить риск систематической ошибки, поскольку при тестировании данных вы можете случайным образом сгруппировать выборку данных в соответствующую группу лечения. Это уравняет размер выборки в их группах.

        • Что хуже, систематическая или случайная ошибка?

        Как систематическая ошибка, так и случайная ошибка нежелательны. Однако систематическая ошибка является более сложной проблемой в исследованиях. Это связано с тем, что ваши выводы отклоняются от правильного значения, и это может привести к ложным выводам.

        Когда в вашем исследовании возникает случайная ошибка, вы знаете, что результат ваших измерений может немного увеличиться или уменьшиться по сравнению с реальным значением. Если вы усредните эти результаты, вы, вероятно, приблизитесь к фактическому значению. Но если ваши измерения имеют систематическую ошибку, ваши выводы будут довольно далеки от истинного значения.


        Оцените свои исследования с помощью простых оценочных форм бесплатно

        

        Случайная и систематическая ошибка | Определение и примеры

        Опубликован в 7 мая 2021 г. по Прита Бхандари. Отредактировано 19 августа 2022 г.

        В научных исследованиях ошибка измерения — это разница между наблюдаемым значением и истинным значением чего-либо. Ее также называют ошибкой наблюдения или экспериментальной ошибкой.

        Существует два основных типа ошибок измерения:

        • Случайная ошибка — это случайная разница между наблюдаемыми и истинными значениями чего-либо (например, исследователь, неправильно взвешивающий весы, записывает неверное измерение).
        • Систематическая ошибка — это постоянная или пропорциональная разница между наблюдаемыми и истинными значениями чего-либо (например, неверно откалиброванные весы постоянно регистрируют веса как более высокие, чем они есть на самом деле).

        Распознавая источники ошибок, вы можете уменьшить их влияние и записывать точные и точные измерения.

        Содержание

        1. Случайные или систематические ошибки хуже?
        2. Случайная ошибка
        3. Уменьшение случайной ошибки
        4. Систематическая ошибка
        5. Уменьшение систематической ошибки
        6. Часто задаваемые вопросы о случайной и систематической ошибке

        Случайные или систематические ошибки хуже?

        В исследованиях систематические ошибки обычно представляют большую проблему, чем случайные ошибки.

        Случайная ошибка — это не обязательно ошибка, а скорее естественная часть измерения. В измерениях всегда есть некоторая изменчивость, даже если вы неоднократно измеряете одно и то же, из-за колебаний окружающей среды, инструмента или ваших собственных интерпретаций.

        Но изменчивость может быть проблемой, когда она влияет на вашу способность делать правильные выводы о взаимосвязях между переменными. Чаще всего это происходит из-за систематической ошибки.

        Точность против точности

        Случайная ошибка в основном влияет на точность , то есть на то, насколько воспроизводимо одно и то же измерение в эквивалентных условиях. Напротив, систематическая ошибка влияет на точность измерения или на то, насколько близко наблюдаемое значение к истинному значению.

        Проведение измерений похоже на попадание в центральную мишень на мишени. Для точных измерений вы должны максимально приблизить свой дротик (ваши наблюдения) к цели (истинным значениям). Для точных измерений вы стремитесь получить повторные наблюдения как можно ближе друг к другу.

        Случайная ошибка приводит к вариации между различными измерениями одного и того же объекта, в то время как систематическая ошибка отклоняет ваше измерение от истинного значения в определенном направлении.

        Когда у вас есть только случайная ошибка, если вы измеряете одно и то же несколько раз, ваши измерения будут иметь тенденцию группироваться или варьироваться вокруг истинного значения. Некоторые значения будут выше, чем истинный балл, а другие будут ниже. Когда вы усредните эти измерения, вы будете очень близки к истинному результату.

        По этой причине случайная ошибка не считается большой проблемой при сборе данных из большой выборки — ошибки в разных направлениях будут компенсировать друг друга при расчете описательной статистики. Но это может повлиять на точность вашего набора данных, если у вас небольшая выборка.

        Систематические ошибки представляют гораздо большую проблему, чем случайные ошибки, поскольку они могут исказить ваши данные, что приведет к ложным выводам. Если у вас есть систематическая ошибка, ваши измерения будут отклонены от истинных значений. В конечном итоге вы можете сделать ложноположительный или ложноотрицательный вывод (ошибка типа I или II) о связи между изучаемыми переменными.

        Случайная ошибка

        Случайная ошибка влияет на ваши измерения непредсказуемым образом: ваши измерения с одинаковой вероятностью могут быть выше или ниже истинных значений.

        На приведенном ниже графике черная линия представляет собой идеальное совпадение между истинными и наблюдаемыми оценками по шкале. В идеальном мире все ваши данные попадут именно на эту линию. Зеленые точки представляют фактические наблюдаемые оценки для каждого измерения с добавлением случайной ошибки.

        Случайная ошибка называется «шумом», поскольку она искажает истинное значение (или «сигнал») измеряемого объекта. Сохранение случайной ошибки на низком уровне помогает собирать точные данные.

        Источники случайных ошибок

        Некоторые распространенные источники случайных ошибок включают:

        • естественных вариаций в реальном мире или в экспериментальных условиях.
        • неточные или ненадежные измерительные приборы.
        • индивидуальных различий между участниками или подразделениями.
        • плохо контролируемых экспериментальных процедур.
        Источник случайной ошибки Пример
        Естественные вариации в контексте В ходе эксперимента по объему памяти участники проходят тесты на память в разное время суток. Тем не менее, некоторые участники, как правило, работают лучше утром, а другие лучше в конце дня, поэтому ваши измерения не отражают истинный объем памяти каждого человека.
        Неточный инструмент Вы измеряете окружность запястья с помощью рулетки. Но ваша рулетка точна только до ближайшего полусантиметра, поэтому при записи данных вы округляете каждое измерение в большую или меньшую сторону.
        Индивидуальные различия Вы просите участников нанести себе безопасный удар электрическим током и оценить уровень боли по 7-балльной шкале. Поскольку боль субъективна, ее трудно надежно измерить. Некоторые участники завышают уровень своей боли, в то время как другие преуменьшают уровень своей боли.

        Уменьшение случайной ошибки

        Случайная ошибка почти всегда присутствует в исследованиях, даже в строго контролируемых условиях. Хотя вы не можете полностью избавиться от нее, вы можете уменьшить случайную ошибку, используя следующие методы.

        Провести повторные измерения

        Простой способ повысить точность — провести повторные измерения и использовать их среднее значение. Например, вы можете измерить окружность запястья участника три раза и каждый раз получать несколько разные значения. Взяв среднее значение трех измерений вместо одного, вы намного приблизитесь к истинному значению.

        Увеличьте размер выборки

        Большие выборки имеют меньшую случайную ошибку, чем маленькие выборки. Это потому, что ошибки в разных направлениях компенсируют друг друга более эффективно, когда у вас больше точек данных. Сбор данных из большой выборки повышает точность и статистическую мощность.

        Переменные управления

        В контролируемых экспериментах вы должны тщательно контролировать любые посторонние переменные, которые могут повлиять на ваши измерения. Их следует контролировать для всех участников, чтобы исключить ключевые источники случайных ошибок по всем направлениям.

        Систематическая ошибка

        Систематическая ошибка означает, что ваши измерения одного и того же объекта будут различаться предсказуемым образом: каждое измерение будет отличаться от истинного измерения в одном и том же направлении, а в некоторых случаях даже на одну и ту же величину.

        Систематическая ошибка также называется предвзятостью, поскольку ваши данные искажены стандартизированными способами, которые скрывают истинные значения. Это может привести к неверным выводам.

        Типы систематических ошибок

        Ошибки смещения и ошибки коэффициента масштабирования являются двумя поддающимися количественной оценке типами систематических ошибок.

        Ошибка смещения возникает, когда весы не откалиброваны на правильную нулевую точку. Ее также называют аддитивной ошибкой или ошибкой установки нуля.

        Пример: ошибка смещения. При измерении окружности запястий участников вы неправильно поняли цифру «2» на рулетке как нулевую точку. Ко всем вашим измерениям добавлены дополнительные 2 сантиметра.

        Ошибка масштабного коэффициента возникает, когда измерения постоянно и пропорционально отличаются от истинного значения (например, на 10%). Ее также называют корреляционной систематической ошибкой или ошибкой множителя.

        Пример: Ошибка коэффициента масштабирования Весы последовательно добавляют 10% к каждому весу. Истинный вес 10 кг записывается как 11 кг, а истинный вес 40 кг записывается как 44 кг.

        Вы можете отобразить ошибки смещения и ошибки коэффициента масштабирования на графиках, чтобы определить их различия. На приведенных ниже графиках черная линия показывает, когда наблюдаемое значение является точным истинным значением и нет случайной ошибки.

        Синяя линия — это ошибка смещения: она сдвигает все ваши наблюдаемые значения вверх или вниз на фиксированную величину (здесь это одна дополнительная единица).

        Розовая линия — это ошибка коэффициента масштабирования: все ваши наблюдаемые значения умножаются на коэффициент — все значения сдвинуты в одном и том же направлении на одну и ту же пропорцию, но на разные абсолютные величины.

        Источники систематических ошибок

        Источники систематических ошибок могут варьироваться от ваших исследовательских материалов до ваших процедур сбора данных и ваших методов анализа. Это не исчерпывающий список источников систематических ошибок, потому что они могут возникать во всех аспектах исследования.

        Предвзятость ответов возникает, когда материалы вашего исследования (например, анкеты) побуждают участников отвечать или действовать недостоверно посредством наводящих вопросов . Например, предвзятость социальной желательности может привести к тому, что участники попытаются соответствовать общественным нормам, даже если они на самом деле не так себя чувствуют.

        Пример: наводящий вопрос. В ходе опроса вы спрашиваете участников, что они думают о действиях по борьбе с изменением климата.

        В вашем вопросе говорится: «Эксперты считают, что только систематические действия могут уменьшить последствия изменения климата. Вы согласны с тем, что отдельные действия бессмысленны?»

        Ссылаясь на «мнения экспертов», этот тип загруженного вопроса сигнализирует участникам, что они должны согласиться с мнением или рискнуть показаться неосведомленными. Участники могут неохотно ответить, что они согласны с утверждением, даже если они этого не делают.

        Дрейф экспериментатора возникает, когда наблюдатели утомляются, скучают или теряют мотивацию после длительных периодов сбора или кодирования данных и постепенно отходят от использования стандартных процедур определенным образом.

        Пример: дрейф экспериментатора (наблюдателя). Вы качественно кодируете видео из социальных экспериментов, чтобы отметить любые совместные действия или поведение между участниками.

        Сначала вы кодируете все незаметные и очевидные действия, соответствующие вашим критериям, как кооперативные. Но, потратив несколько дней на эту задачу, вы кодируете только чрезвычайно полезные действия как совместные.

        Вы постепенно отходите от первоначальных стандартных критериев кодирования данных, и ваши измерения становятся менее надежными.

        Систематическая ошибка выборки возникает, когда некоторые члены совокупности с большей вероятностью будут включены в ваше исследование, чем другие. Это снижает обобщаемость ваших результатов, потому что ваша выборка не является репрезентативной для всего населения.

        Уменьшение систематической ошибки

        Вы можете уменьшить систематические ошибки, применяя эти методы в своем исследовании.

        Триангуляция

        Триангуляция означает использование нескольких методов для записи наблюдений, чтобы вы не полагались только на один инструмент или метод.

        Например, если вы измеряете уровень стресса, вы можете использовать в качестве индикаторов ответы на опросы, физиологические записи и время реакции. Вы можете проверить, сходятся или перекрываются все три измерения, чтобы убедиться, что ваши результаты не зависят от конкретного используемого прибора.

        Регулярная калибровка

        Калибровка прибора означает сравнение того, что регистрирует прибор, с истинным значением известной стандартной величины. Регулярная калибровка вашего прибора с помощью точного эталона помогает снизить вероятность систематических ошибок, влияющих на ваше исследование.

        Вы также можете калибровать наблюдателей или исследователей с точки зрения того, как они кодируют или записывают данные. Используйте стандартные протоколы и рутинные проверки, чтобы избежать дрейфа экспериментатора.

        Рандомизация

        Методы случайной выборки помогают гарантировать, что ваша выборка систематически не отличается от генеральной совокупности.

        Кроме того, если вы проводите эксперимент, используйте случайное распределение, чтобы поместить участников в разные условия лечения. Это помогает противостоять предвзятости, уравновешивая характеристики участников между группами.

        Маскировка

        По возможности следует скрыть задание условия от участников и исследователей с помощью маскировки (ослепления).

        На поведение или реакцию участников могут влиять ожидания экспериментатора и характеристики спроса в окружающей среде, поэтому контроль над ними поможет вам уменьшить систематическую предвзятость.

        Часто задаваемые вопросы о случайной и систематической ошибке

        Случайная и систематическая ошибка — это два типа ошибок измерения.

        Случайная ошибка — это случайная разница между наблюдаемыми и истинными значениями чего-либо (например, исследователь, неправильно взвешивающий весы, записывает неверное измерение).

        Систематическая ошибка — это постоянная или пропорциональная разница между наблюдаемыми и истинными значениями чего-либо (например, неверно откалиброванные весы постоянно записывают веса выше, чем они есть на самом деле).

        Случайная ошибка или систематическая ошибка хуже?

        Случайная ошибка почти всегда присутствует в научных исследованиях, даже в строго контролируемых условиях. Хотя вы не можете полностью избавиться от нее, вы можете уменьшить случайную ошибку, выполняя повторные измерения, используя большую выборку и контролируя посторонние переменные.

        Вы можете избежать систематических ошибок, тщательно разработав процедуры отбора проб, сбора данных и анализа. Например, используйте триангуляцию для измерения ваших переменных несколькими методами; регулярно калибровать инструменты или процедуры; использовать случайную выборку и случайное распределение; и применяйте маскировку (ослепление), где это возможно.

        Полезна ли эта статья?

        Вы уже проголосовали. Спасибо 🙂 Ваш голос сохранен 🙂 Обработка вашего голоса…

        Прита имеет академическое образование в области английского языка, психологии и когнитивной нейробиологии. Как междисциплинарный исследователь, она любит писать статьи, объясняющие сложные исследовательские концепции для студентов и ученых.

        Z-14: Оценка аналитических ошибок с помощью регрессионной статистики

        Довольно абстрактной статистики: как мы используем эти вещи в лаборатории? В этой статье рассказывается о практическом применении статистики на уровне стенда, в том числе о том, как найти смещение и другие важные статистические данные.

        EdD, доцент

        Программа клинических лабораторных исследований, Университет Луисвилля
        Луисвилл, Кентукки
        Октябрь 2000 г.
        • Обзор регрессионной модели
        • Стандартная ошибка регрессии и случайная ошибка
        • Y-пересечение и постоянная систематическая ошибка
        • Наклон и пропорциональная систематическая ошибка
        • Смещение и общая систематическая ошибка
        • Проблемы с регрессией
        • Ссылки

        В предыдущем уроке мы описали регрессию классическим способом. В этом уроке мы опишем практические лабораторные приложения и некоторые сложности, возникающие при работе с реальными экспериментальными данными. Язык и приложения регрессии окружают нас повсюду в лаборатории, особенно в устоявшихся практиках проверки методов и контроля качества. Такие термины, как смещение, (Ybar-Xbar), [(bXbar + a) – Xbar], наклон, точка пересечения и S y/x и это лишь некоторые из них, все они основаны на терминологии регрессии. В этом уроке мы покажем, как можно использовать статистику регрессии для оценки аналитических ошибок, возникающих при использовании лабораторного метода. Мы сосредоточимся на сравнении экспериментальных методов, которые обычно используются для подтверждения того, что новый метод дает результаты, согласующиеся со старым методом, который заменяется.

        Обзор регрессионной модели

        На прошлом уроке мы рассмотрели вывод коэффициента наклона линии регрессии на основе показателей отклонения переменных X и Y. Линия регрессии дает уравнение, которое можно использовать для прогнозирования Y по X (Y=bX + a). Чаще всего точки данных, которые изображают «реальный Y» или Y-наблюдаемый, не лежат на этой линии регрессии, поэтому важно количественно оценить объяснимые и необъяснимые компоненты. Для этого мы рассмотрели несколько Y, включая общее среднее значение Y, значение Y, предсказанное из X, и значение Y, наблюдаемое в точке данных. На диаграмме Несколько Ys расстояние от Y’ или Y-прогнозированного-из-X до общего среднего было названо Y-объяснением или Y-регрессией. Расстояние от Y’ до наблюдаемой Y- называется Y-ошибкой, которая часто отображается на диаграмме рассеяния вертикальным расстоянием или линиями, проведенными от точек данных до линии регрессии.

        В наших математических расчетах мы создали еще пять столбцов (от C-8 до C-12), которые представляли расчеты Y-прогноз, Y-остаток или ошибка, Y-остаток в квадрате или сумма квадратов ошибок (ESS), Y -объясненная или Y-регрессия, Y-объясненная квадратичная или регрессия суммы квадратов (RSS). Добавление ESS и RSS дало общую сумму квадратов или TSS. Квадрат R или дисперсия Y, объясняемая регрессией, представляла собой отношение SS регрессии к TSS. Чем больше это число, тем эффективнее X предсказывает Y. Например, если R² = 0,80, то мы на 80 % лучше предсказываем Y, используя X, чем предсказываем Y, используя среднее значение его собственного распределения. Таким образом, регрессию можно использовать для описания силы связи между X и Y9.0007

        Интересно 1-R² — это дисперсия Y, не объясняемая X. Этот термин также называется допуском, лямбдой Уилка и имеет другие названия. Он равен SS ошибки, деленному на TSS.

        Стандартная ошибка регрессии и случайная аналитическая ошибка (RE)

        Как обычно, нам нужно рассмотреть некоторые стандартные ошибки. При наблюдении «линии наилучшего соответствия» в методе наименьших квадратов для каждого Y, предсказанного на основе определенного X, используется наилучшая оценка. Линия аппроксимируется таким образом, что каждое наблюдаемое значение Y оценивается по наименьшему квадрату расстояния от линии. Однако даже при этом предсказанном Y всегда существует некоторая неопределенность (вероятность) относительно того, где каждый Y находится по отношению к своему X. Из-за этого вокруг каждой точки на линии регрессии можно построить мини-нормальное распределение, как показано на рис. сопровождающая фигура.

        Точка на линии появляется в наиболее вероятной точке этого частотного распределения — в среднем. Это мини-распределение представляет стандартную ошибку 90 550 относительно линии регрессии 90 551, называемую SD линии регрессии, или стандартную ошибку 90 550 оценки 90 551 или s 90 544 y/x 90 545. Эта статистика должна быть включена как часть расчетов регрессии для любого сравнения экспериментальных методов, чтобы обеспечить оценку случайной ошибки между методами. Обратите внимание, что эта оценка будет включать случайную ошибку обоих методов, а также любую систематическую ошибку, которая варьируется от выборки к выборке (например, интерференция, которая варьируется от выборки к выборке). Поэтому ожидается, что она будет больше, чем погрешность метода испытаний, и не заменит погрешность, определенную для данных повторного эксперимента.

        Эта вариация линии регрессии также дает нам информацию о надежности наклона и точки пересечения, поскольку для стандартной ошибки наклона, называемой S b , и стандартной ошибки точки пересечения, называемой S, можно рассчитать дополнительные члены. и . Компьютерные программы могут использовать эти термины для расчета доверительных интервалов для наклона и точки пересечения. В идеале регрессия между двумя методами тестирования должна иметь наклон 1,00 и точку пересечения 0,0. Значимость небольших отклонений от идеального наклона и идеального пересечения можно оценить с помощью S b и S a для расчета доверительных интервалов относительно наблюдаемого наклона и точки пересечения. Если интервалы перекрываются с идеальными значениями, то отличия от идеальных не имеют практического значения, т. е. не являются статистически значимыми. (Идеальный означает, что 1,00 находится в интервале наклона, а 0 — в интервале пересечения.)

        Y-отрезок и постоянная систематическая ошибка (CE)

        При сравнении двух методов, x и y, с использованием регрессии, давайте посмотрим, что произошло бы, если бы точка пересечения линии регрессии не находилась в точке 0,0 для x и y, как показано на следующем рисунке. Пунктирная линия представляет идеальную производительность. Сплошная линия не проходит через 0,0 или начало графика. Скорее, он никогда не регистрирует нулевое значение по оси Y. Причина этого в том, что уравнение регрессии здесь не y = 1x + 0. Скорее формула имеет вид y = 1x + 3. То есть константа в формуле (a) отлична от нуля. Когда x равно нулю, y будет числом три. Поэтому линия пересекает ось Y не в нулевой точке, а в точке 3. Постоянный член в уравнении регрессии показывает отклонение или ошибку от идеального значения нуля. Такая проблема обычно возникает из-за какого-либо вмешательства в анализ, неадекватного гашения или неправильной установки нулевой точки калибровки. Было бы полезно проверить доверительный интервал вокруг константы, используя s и . Если ноль попадает в доверительный интервал, то отклонение не имеет значения. Если ноль не падает с интервалом, то отклонение показывает постоянную систематическую ошибку между методами.

        Наклон и пропорциональная систематическая ошибка (PE)

        При тестировании двух методов, x и y, давайте посмотрим, что произойдет, если наклон линии регрессии не равен единице. На приведенном здесь рисунке пунктирная линия представляет идеальное соотношение 1:1 между x и y. Точка пересечения равна 0,0, а наклон линии составляет угол 45 градусов с основанием графика. При каждом увеличении x на единицу y также увеличивается на единицу. Сплошная линия показывает меньший наклон, например, эта линия представляет уравнение регрессии, такое как y = 0,8x + 0. Здесь при каждом увеличении x на единицу y увеличивается в 0,8 раза. Было бы полезно протестировать доверительный интервал вокруг наклона, используя S б . Если значение 1,0 попадает в доверительный интервал, то отклонение не имеет значения. Если 1,0 не падает с интервалом, то отклонение показывает пропорциональную систематическую ошибку между методами. Что-то не так, что приводит к потере пропорциональности с y. Этот тип ошибки, величина которой увеличивается по мере увеличения концентрации аналита, часто вызван плохой стандартизацией или калибровкой. Иногда это вызвано веществом в матрице пробы, которое реагирует с искомым аналитом и поэтому конкурирует с аналитическим реагентом.

        Погрешность и общая систематическая ошибка (SE)

        Общая систематическая ошибка часто рассматривается как погрешность между процедурами тестирования, которая подразумевает, что один метод работает выше или ниже другого. Как обсуждалось в предыдущих уроках, систематическая ошибка может быть рассчитана как часть статистики t-критерия и обеспечивает оценку средней разницы между значениями, полученными двумя методами, или разницу между средними значениями двух методов для серии образцов. Важно понимать, что эта оценка смещения будет применяться к среднему значению данных, т. е. она представляет собой среднюю или общую систематическую ошибку среднего значения данных.

        Если бы было интересно узнать общую систематическую ошибку при концентрации решения, важной с медицинской точки зрения, X C , которая не соответствует среднему значению данных, то уравнение регрессии становится полезным. Например, результаты теста для метода измерения уровня глюкозы могут быть критически интерпретированы на нескольких различных уровнях принятия решений, таких как 50 мг/дл для гипогликемии, 110 мг/дл для уровня глюкозы натощак и 150 мг/дл для теста на толерантность к глюкозе. Для оценки систематических ошибок при этих трех концентрациях медицинских решений целесообразно использовать регрессионную статистику. Значение Y, соответствующее концентрации медицинского решения, Y C , рассчитывается из уравнения регрессии Y C = bX C + a. Разница Y C – X C представляет собой систематическую ошибку на уровне медицинского решения X C .

        Например, на приведенном здесь рисунке показаны три концентрации медицинских решений, которые важны для интерпретации теста. Систематическая ошибка на высоком уровне медицинского решения, X C3 , является отрицательной, т. е. значения y ниже, чем значения x при высоких концентрациях. При низкой концентрации медицинского решения X C1 значения y выше значений x, что дает положительную систематическую ошибку. В середине диапазона систематическая ошибка отсутствует. Если бы данные сравнения методов были проанализированы с помощью статистики t-критерия, а среднее значение x попало бы в середину диапазона, систематической ошибки не наблюдалось бы, даже несмотря на то, что очевидно существуют систематические различия при низких и высоких концентрациях.

        Проблемы с регрессией

        Как отмечалось в предыдущих уроках, существуют определенные допущения, которые должны выполняться при регрессионном анализе:

        • Предполагается линейная зависимость;
        • X-значения считаются “истинными” и не содержат ошибок;
        • Предполагается, что
        • Y-значения показывают гауссово распределение;
        • Предполагается, что случайная ошибка является равномерной во всем диапазоне изучаемых данных, т. е. существует предположение о гомоскедастичности, что означает, что дисперсия y считается одинаковой для каждого значения x.
        • Выбросы — отдельные точки, которые кажутся не соответствующими общему распределению или разбросу данных — могут серьезно повлиять на значения наклона и точки пересечения.

        Регрессионные приложения с реальными лабораторными данными могут иметь некоторые или все эти проблемы! Вот несколько практических способов борьбы с ними.

        Линейная зависимость. Изучите график данных, чтобы определить, существует ли линейная зависимость. Обратите особое внимание на верхние и нижние границы данных. При необходимости ограничьте статистический анализ данными, которые показывают линейную зависимость

        Ошибка в значениях x. В значениях x всегда будет некоторая ошибка, если они являются измерениями сравнительного метода, даже если этот метод очень точен. Ошибки не будут искажать статистику регрессии до тех пор, пока диапазон данных широк по сравнению с неточностью сравнительного метода. Коэффициент корреляции представляет собой удобный индикатор. Если р равно 0,99 или выше, можно не беспокоиться о влиянии ошибки на x-значения. Если r меньше 0,95, необходимо соблюдать особую осторожность. Это может включать сбор дополнительных данных для расширения изучаемого диапазона и достижения более высокого значения r. Или это может включать использование альтернативных статистических расчетов, таких как анализ t-критерия, если среднее значение данных близко к интересующей концентрации медицинских решений, или более сложных методов регрессии, таких как регрессия Деминга [1]. Обратите внимание, что одна или несколько высоких или низких точек могут иметь большое влияние на значение коэффициента корреляции, поэтому полезно изучить график данных и убедиться, что данные охватывают диапазон достаточно равномерно.

        Распределения Гаусса. В случае сравнения экспериментальных методов значения y являются значениями измерений и должны быть гауссовыми. Обратите внимание, что требование к гауссовым значениям относится не к распределению пациентов, а к распределению измерений, которые будут получены на отдельных выборках пациентов. Это предположение разумно, потому что мы имеем дело с вариацией измерения, а не с вариацией совокупности (там, где это было бы неразумно).

        Гомоскедастичность. Самое главное научиться произносить это слово, чтобы вы могли звучать как статистик. На практике это допущение нарушается большинством методов, но не настолько серьезно, чтобы требовать перехода к альтернативным расчетам, таким как взвешенная регрессия. Протокол NCCLS EP9-A для сравнительных исследований методов [2] рекомендует проводить визуальную проверку равномерного разброса, чтобы определить, есть ли какие-либо существенные различия между разбросом на верхнем и нижнем концах. В этом протоколе в качестве ориентира используется соотношение 3:1, что означает, что все в порядке, если разброс на верхнем уровне менее чем в 3 раза превышает разброс на нижнем уровне.

        Выбросы. Отдельные точки вблизи концов диапазона могут оказывать влияние на отмену на значения наклона и точки пересечения. Думайте о линии регрессии как о качелях, которые балансируют на среднем значении значений x и y. Единственная точка, находящаяся далеко от линии, имеет больший вес, когда она находится ближе к концу качелей, и тянет линию в этом направлении. Высокая точка на верхнем конце диапазона будет тянуть линию вверх, вызывая увеличение наклона и уменьшение точки пересечения (эффект качания). Поскольку нижняя точка на верхнем конце диапазона будет тянуть линию вниз, вызывая уменьшение наклона и увеличение точки пересечения. Простой способ обнаружить выбросы — просмотреть график сравнительных данных. Некоторые люди предпочитают использовать для этой цели график разностей или график остатков относительно линии регрессии. Удаление выбросов требует большой осторожности, потому что вы вмешиваетесь в набор данных. Лучше всего повторно протестировать образец и убедиться, что была допущена ошибка, прежде чем удалять какие-либо точки данных. Проблемы с выбросами можно свести к минимуму путем проведения повторных измерений, тщательной проверки и построения графика данных во время их сбора и повторного тестирования несоответствующих результатов, пока образцы все еще доступны.

        Для дополнительного обсуждения использования регрессионной статистики в сравнительных исследованиях методов см. MV — Набор инструментов для анализа данных и рекомендации по использованию статистики при проверке методов на этом веб-сайте. Обратите внимание, что калькулятор регрессии доступен как часть калькулятора парных данных в наборе инструментов для анализа данных на этом веб-сайте.

        Ссылки

        1. Cornbleet PJ, Gochman N. Неверные коэффициенты регрессии методом наименьших квадратов в сравнении методов. Клин Хим 1979;25:432-438.
        2. НККЛС. Сравнение методов и оценка погрешности с использованием образцов пациентов: утвержденное руководство. Документ NCCLS EP9-A. NCCLS, 940 West Valley Road, Suite 1400, Wayne, PA 19087.

        Неопределенности в измерениях — Химия LibreTexts

        1. Последнее обновление
        2. Сохранить как PDF
      • Идентификатор страницы
        355
      • Все измерения имеют некоторую степень неопределенности независимо от точности и аккуратности. Это вызвано двумя факторами: ограничениями измерительного прибора (систематическая ошибка) и мастерством экспериментатора, проводящего измерения (случайная ошибка).

        Введение

        Градуированная бюретка на рис. 1 содержит определенное количество измеряемой воды (с желтым красителем). Количество воды где-то между 19мл и 20 мл по отмеченным линиям. Проверяя, где находится дно мениска, ориентируясь на десять меньших линий, количество воды находится между 19,8 мл и 20 мл. Следующим шагом является оценка неопределенности между 19,8 мл и 20 мл. Делая приблизительное предположение, уровень меньше 20 мл, но больше 19,8 мл. Затем мы сообщаем, что измеренное количество составляет примерно 19,9 мл. Сам градуированный цилиндр может быть деформирован таким образом, что деления шкалы будут содержать неточности, дающие показания, немного отличающиеся от фактического объема присутствующей жидкости.

        Рисунок 1 : Вид мениска в бюретке с окрашенной водой. «20,00 мл» — правильное измерение глубины. Щелкните здесь, чтобы получить более полное описание использования бюретки, включая правильное чтение. Рисунок использован с разрешения Википедии.

        Систематическая и случайная ошибка

        На приведенной ниже диаграмме показано различие между систематическими и случайными ошибками.

        Рисунок 2: Систематические и случайные ошибки. Рисунок использован с разрешения Дэвида ДиБиасе (Penn State U).

        Систематические ошибки: Когда мы используем инструменты, предназначенные для измерения, мы предполагаем, что они правильные и точные, однако измерительные инструменты не всегда правильные. На самом деле, у них есть ошибки, которые возникают естественным образом, называемые систематическими ошибками . Систематические ошибки имеют тенденцию быть постоянными по величине и/или направлению. Если величина и направление ошибки известны, точность можно повысить с помощью аддитивных или пропорциональных поправок. Аддитивная коррекция включает добавление или вычитание постоянного поправочного коэффициента к каждому измерению; пропорциональная коррекция включает умножение измерения(ий) на константу.

        Случайная ошибка s: Случайная ошибка, иногда называемая человеческим фактором, определяется навыками или способностью экспериментатора проводить эксперимент и считывать результаты научных измерений. Эти ошибки являются случайными, поскольку полученные результаты могут быть слишком высокими или низкими. Часто случайная ошибка определяет точность эксперимента или ограничивает точность. Например, если бы нам нужно было рассчитать время оборота постоянно вращающегося поворотного круга, случайной ошибкой было бы время реакции. Время нашей реакции будет варьироваться из-за задержки начала (недооценка фактического результата) или задержки остановки (переоценка фактического результата). В отличие от систематических ошибок случайные ошибки различаются по величине и направлению. Однако можно рассчитать среднее значение набора измеренных положений, и это среднее, вероятно, будет более точным, чем большинство измерений.

        1. Поскольку Том должен полагаться на прибор для определения абсорбции, а он обеспечивает постоянно разные измерения, это пример систематической ошибки.
        2. Большая часть отклонений во времени Клэр, вероятно, может быть связана со случайной ошибкой, такой как усталость после нескольких кругов, непостоянство в технике плавания, небольшое расхождение во времени запуска и остановки секундомера или бесчисленное множество других мелких факторов, которые влияют на время круга. В гораздо меньшей степени сам секундомер может иметь ошибки в отсчете времени, приводящие к систематической ошибке.
        3. Процентная ошибка исследователя составляет около 0,62%.
        4. Это известно как ошибка множителя или коэффициента масштабирования.
        5. Это называется смещением или ошибкой установки нуля.
        6. Процентная ошибка Сьюзен составляет -7,62%. Эта процентная ошибка является отрицательной, поскольку измеренное значение падает на ниже принятого значения на . В задаче 7 процентная ошибка была положительной, поскольку она была на 90 550 больше, чем 90 551, чем принятое значение.
        7. Сначала нужно взвесить сам стакан. После получения веса вы добавляете графит в химический стакан и взвешиваете его. Получив этот вес, вы вычитаете вес графита плюс вес стакана минус вес стакана.

        Неопределенности в измерениях распространяется по незадекларированной лицензии и был создан, изменен и/или курирован LibreTexts.

        1. Наверх
        • Была ли эта статья полезной?
        1. Тип изделия
          Раздел или страница
          Показать страницу TOC
          нет на странице
        2. Теги
          1. точность
          2. ошибка
          3. точность
          4. случайность

        Глава 1 Выдержки

        Глава 1 Выдержки
          1. 1. 4 Основные статистические данные Обработка
          2. Цель измерений окружающей среды может быть качественной или количественной. За например, наличие свинца в бытовой краске вызывает озабоченность. Вопрос может be “Есть ли токсичные металлы в краске в определенном доме?” Анализ для решения этого вопроса предназначен качественный анализ , где аналитик экраны на наличие определенного загрязнителя или класса веществ. Следующий очевидный вопрос, конечно, “Сколько свинца в краске?” Этот тип анализа называется количественный анализ и не только решает вопрос наличие свинца в краске, но и его концентрация.

            Предположим, что аналитик использует технику, позволяющую измерять всего 1 м г/кг свинца в краске. Для конкретного образца он говорит, что нет свинца был обнаружен. Это означает, что концентрация свинца в этом образце составляет менее 1 мкг/кг. Неправильно сообщать результаты этого анализа как «нулевой свинец», так как он вполне может присутствовать в более низкой концентрации, которую наши измерительный прибор не может обнаружить. В отчете должно быть указано «свинец не обнаружен при концентрации выше 1 м г/кг» или «свинец не обнаружен; предел обнаружения 1 м г/кг». Количественный анализ проб окружающей среды особенно сложной задачей, поскольку концентрации загрязняющих веществ в пробах окружающей среды часто очень низки, а матрица обычно сложна.

            1. Ошибки в количественном Анализ
            2. Все численные результаты, полученные в результате экспериментов, сопровождаются определенная величина ошибки, и оценка величины этой ошибки необходима для подтвердите результаты. Ошибка — это статистический термин, и его не следует путать с общепринятое значение слова, предполагающее оплошность и возложение вины на кого-то! Все измерения имеют некоторую погрешность, связанную с ними. Его нельзя устранить, но с тщательной работы можно охарактеризовать величину ошибки и, иногда, величина может быть уменьшена с помощью усовершенствованных методов.

              В общем, типы ошибок можно классифицировать как случайные или систематические . Если один и тот же эксперимент повторить несколько раз, отдельные измерения упадут около среднего значения. Различия обусловлены неизвестными или неконтролируемыми факторами, и называются случайной ошибкой . Случайные ошибки, если они действительно случайны, должны группироваться. вокруг истинного значения и имеют равную вероятность быть выше или ниже его. Скорее всего что измерения будут немного завышены или немного занижены чаще, чем они будут очень высокий или очень низкий. Мера количества случайных ошибок, присутствующих в наборе данных. это точность или воспроизводимость .

              С другой стороны, систематическая ошибка имеет тенденцию отклоняться или смещать все измерения в одном направлении. Итак, точность , которая является мерой отклонения от на истинное значение влияет систематическая ошибка. Точность определяется как отклонение среднего значения от истинного.

              Точность = (среднее – истинное значение) / истинное значение ( .1)

              Часто истинное значение неизвестно. Для целей сравнения измерение установленным методом или принятым учреждением иногда принимается за истинное значение. В разговорном английском языке точность и точность часто используются как синонимы, но в статистика они означают совсем разные вещи.

              Различие между точностью и прецизионностью дополнительно иллюстрируется следующим пример. Пробу, содержащую 10 м г/кг свинца, анализируют методом кислотное расщепление и атомно-абсорбционная спектрометрия. Пять повторных анализов выполняются четыре разных лаборатории, в результате чего данные представлены в таблице .4 и на рисунке .1. Анализы, выполненные лабораторией А, показывают меньшую вариабельность, но не близки к истинным. ценность. Таким образом, работа этой лаборатории имеет высокую точность, но низкую точность. Это явный признак того, что эта лаборатория подвержена некоторому идентифицируемому источнику систематической ошибки. Его калибровки, стандарты и методы должны быть тщательно изучены. Данные лаборатории Ds с другой стороны, показывают небольшую изменчивость и хорошую точность. Лаборатории B и C имеют данные с меньшей точностью, но один точен, а другой нет. Собственно, для малое количество повторов, когда хорошая точность достигается с плохой точностью, это обычно случайно!

            3. Статистика повторных измерений: Точность
              1. Точность и стандартное отклонение

              Поскольку каждое измерение содержит определенную ошибку, результат одного измерение не может быть принято само по себе как истинное значение. Оценка ошибки необходимо предсказать, в каком диапазоне может лежать истинное значение. Случайная ошибка в измерение оценивается повторением измерения несколько раз, что обеспечивает два ценная информация: среднее значение и изменчивость измерение . Наиболее широко используемой мерой среднего значения является среднее арифметическое, ,

              .

              ( .2)

              , где S x i — сумма повторов измерений, а n – общее количество измерений.

              Наиболее полезной мерой изменчивости (или точности) является стандартное отклонение, s . Это рассчитывается как:

        ( .3)

              Когда доступно только несколько фрагментов данных, расчетное стандартное отклонение может быть занижена, так как среднее значение используется как истинное значение, а среднее рассчитано из тот же небольшой набор данных. Чтобы получить несмещенную оценку s , который обозначается как s , в знаменателе используется N-1.

        ( .4)

              По мере увеличения количества точек данных значение s приближается к значению s . Когда N достигает 20, можно использовать уравнение для s. Другой термин, обычно используемый для измерения изменчивости называется коэффициентом вариации (CV) или относительным стандартным отклонением (РСД). Он также может быть выражен в процентах

              ОСО = (с/) или % ОСО = (с/) x 100 ( .5)

              Относительное стандартное отклонение является предпочтительным параметром для сравнения точности данных различных единиц и величин и широко используется в аналитических науках.

            1. Распространение ошибки
            2. При отсутствии систематической ошибки и при большом количестве измерений результаты попадают в нормальное или гауссово распределение. Нормальное распределение определяется уравнением

              (.6)

              , где y — частота появления, а m — частота среднее арифметическое. Нормальное распределение имеет колоколообразную форму. В наборе данных, который нормально распределены, 68% измерений будут лежать в пределах 1 с от среднего, 95% в течение 1,96 с и 99,7% в течение 2,97 с. Следует отметить, что не всегда можно доказать что повторные измерения попадут в нормальное распределение, но в целом обеспечивает хорошее приближение. Это особенно верно, когда количество измерений не очень большой.

              При измерениях окружающей среды часто бывает так, что аналитический метод используется вблизи предела обнаружения. Это может привести к искаженным наборам данных, которые не отображают нормальное распределение. В случаях, когда распределение не является нормальным, среднее может не быть лучший показатель «центра» такого набора. Эти наборы данных обычно содержат некоторые высокие выбросы, но низкие выбросы просто сообщаются как «не обнаружен». Эффект заключается в том, чтобы отсекать нормальное распределение на нижней стороне. Когда высокие ошибки более вероятны, чем низкие, логарифмически нормальное распределение часто соответствует данным лучше. На рис. 2 показаны кривые нормального и логарифмически нормального распределения. Есть несколько способы обработки логнормальных данных. Как следует из названия «логарифмическая норма», логарифмы данных нормально распределены. Это означает, что можно взять журнал каждого данных точка, а затем сделать статистические расчеты. В конце антилог конечного значения взят. Например, среднее геометрическое, вычисленное как антилогарифм арифметического среднее логарифмов n точек данных, может дать лучшую оценку центра данные, если присутствует логарифмически нормальное распределение.

                      ( .7)

              Иногда вместо обнуления значений выборки «не обнаружено» устанавливается до 1/2 предела обнаружения метода, но этот метод не является общепризнанным, и его статистическая достоверность не доказана.

              При работе с ненормально распределенными данными медиана , центральное значение когда все точки расположены по модулю или по моде , чаще всего возникающее значение в некоторых случаях лучше описывает центральную тенденцию данных.

            3. Доверительный интервал и t-распределение.
            4. Если нет систематической ошибки, то распределение случайной ошибки может быть рассчитывается по серии измерений. Таким образом, можно прогнозировать с определенной количество «достоверности», диапазон, в котором должно лежать истинное значение. Этот диапазон называется доверительным интервалом , а конечные значения этого диапазона называются доверительные интервалы . Чем больше доверительный интервал, тем выше вероятность того, что истинное значение находится в пределах этого доверительного интервала. Если мы предположим нормальное распределение погрешности, то 95% измерений будут лежать между . Это 95% доверительный интервал, т.е. существует 95% вероятность что истинное значение находится в этом диапазоне. Точно так же доверительный интервал 99,7% падает между .

              Если количество измерений невелико, расчетный экспериментальный стандарт отклонение (s) не равно s . Так что в этом случае вместо нормальное распределение, доверительный интервал рассчитывается с использованием Стьюдента-t распределение. Таблица t-распределения представлена ​​в Приложении 1. В этом случае доверительный интервал рассчитывается как:

              ( .8)

              Значение t определяется по таблице распределения t и зависит от число степеней свободы, которое на одну меньше числа измерений (n-1), и желаемый уровень достоверности.

              1. Оценка среднего из нескольких наборов измерений
              2. Иногда несколько наборов данных объединяются, и из объединенные данные. Например, каждый год в городе проводится несколько замеров угарного газа. день, а в конце месяца необходимо получить общее среднее. Если точность различные наборы данных существенно не отличаются, можно вычислить общее среднее значение как:

                (.9)

                и соответствующее стандартное отклонение:

                (.10)

                , где веса, W k, — соответствующее количество измерений в каждом ниже среднего.

                Если точность различных наборов значительно различается, значения взвешиваются. обратно пропорционально их дисперсии (s 2 ):

                ( .11)

                , затем уравнение 1.9применены.

              3. Оценка стандартного отклонения по нескольким наборам Размеры

            Точно так же, как несколько средств могут быть объединены для получения общего среднего, стандартные отклонения также могут быть объединены для получения единой оценки. Если имеется k наборов измерений стандартные отклонения которых существенно не отличаются, то объединенный стандарт отклонение, с p , можно рассчитать как:

            ( .12)

            , где s 1 , s 2 и s i являются стандартными отклонениями i Отдельные наборы измерений. Количество измерений в этих наборах n 1 , n 2 и n i соответственно.

          1. 1.5 Тесты значимости
          2. Как упоминалось ранее, из-за случайной ошибки измеренное среднее значение редко точно соответствует истинному значению. Критерии значимости используются для определения того, является ли разница между известным значением и измеренным значением или между двумя измеренными значениями может быть связано с только случайная ошибка. Сравниваемые величины могут быть средними и стандартными отклонениями. из двух разных наборов измерений, чтобы увидеть, действительно ли средства различаются, или увидеть, является ли определенное измерение статистически невероятным выбросом.

              1. Сравнение измеренного и известного значения
              2. Часто важно знать, верно ли среднее значение нескольких измерений. значительно отличается от известного значения. Известное значение может быть заданным стандартом значение или нормативный порог для соблюдения экологических норм. Значение должна быть определена разница между экспериментальным и известным или целевым значением, чтобы посмотреть, вызвана ли разница только случайной ошибкой или действительно есть разница, статистически значительная разница, между двумя числами. Для этого доверительный интервал для рассчитывается измеренное среднее значение. Если целевое значение попадает в тот же диапазон, то оно можно сказать, что эти два значения не отличаются на этом уровне достоверности.

              3. Сравнение среднего значения двух выборок:
              4. Этот тип сравнения необходим, например, когда два набора измерения проводятся в разных лабораториях или с использованием разных аналитических методик. Это также может быть полезно при сравнении двух наборов выборок из разных популяций. или областей, чтобы определить, является ли измеряемая переменная (концентрация, температура, pH или что угодно), действительно отличается между двумя популяциями, или если разница может быть объясняется только случайной ошибкой.

                Пусть x a и x b будут средними значениями двух наборов измерений. чьи стандартные отклонения равны s a и s b соответственно. Тогда мы должны определить, является ли разница между этими средними значениями ( x a – x b ) значительно отличается от нуля в пределах выбранного доверительного интервала.

                Случай 1 : Когда не учитываются стандартные отклонения двух наборов измерений существенно отличаться друг от друга, например, если были взяты пробы воды из двух хорошо смешанных источников, и все они были сделаны одним и тем же аналитиком с использованием одного и того же метода. Если есть сомнения относительно того, отличаются ли стандартные отклонения или нет, F-критерий, описанные ниже, дадут эту информацию. Рассчитываются дисперсии обоих средних как:

                (.13)

                , используя объединенное значение s. Затем выбирается желаемый уровень достоверности. неопределенность разницы между двумя средними значениями рассчитывается как:

                (.14)

                , используя значение t, из таблицы t-распределения, соответствующее выбранный уровень вероятности и количество степеней свободы (n A + n B – 2). Если разница между двумя исследуемыми средними не превышает неопределенность в разнице, UD , значит не считается разным.

                Случай 2 : Если предполагается, что s 1 и s 2 могут быть существенно отличаются друг от друга, то дисперсии средних составляют:

                (.15)

                Эффективное число степеней свободы f:

         

        ( .16)

                Результат приведенного выше уравнения округляется до ближайшего целого числа.

                Наконец, ( .17)

                с использованием значения f , рассчитанного выше, и желаемого уровня достоверности для определения значение t* должно быть выбрано из t-таблицы. Если разница между двумя средними проверяемого не превышает неопределенности в разнице UD , значит, средние значения существенно не различаются.

                Пример: Следующие данные были получены для ПХБ в тканях рыб из двух разных реки. Являются ли две популяции рыб загрязненными в значительно разной степени? в 95% уровень достоверности?

                Река А Река Б
                2,34 нг/г 1,55
                2,66 1,82
                1,99 1,34
                1,91 1,88

                Сначала необходимо определить средние значения и стандартные отклонения каждой группы. вычислено. Среднее значение для A равно 2,225, а SD равно 0,29.88. Для B среднее значение равно 1,648, а SD равно 0,2417.

                Отклонения каждого из средних:

         

        Эффективное число степеней свободы:

                Значение t для 95% CL и 6 степеней свободы равно 2,45.

                Разница между двумя средними значениями составляет 2,225 – 1,648 = 0,577. Неуверенность в разница 0,90. Неопределенность больше, чем разница, поэтому значительная разница в этих двух партиях рыбы при 95% CL.

              1. Сравнение стандартных отклонений с использованием F-критерия

              F-критерий используется для сравнения точности двух наборов аналитических измерений. измерения могут производиться различными методами, лабораториями или приборами. Они также могут быть серия разных выборок из разных популяций, как в примере выше. Если с 1 и s 2 — стандартные отклонения двух измерений, значение F равно рассчитывается как:

              (.18)

              Значение F сравнивается с критическим значением F c из стандартных таблиц. Значение F c зависит от степеней свободы двух измерений, и выбранный уровень достоверности. Если расчетное F не превышает F c из таблицы, то можно сделать вывод, что стандартные отклонения не различаются.

              Пример: Если мы хотим сравнить отклонения в содержании ПХБ в рыбе в две реки, мы можем применить тест f к данным, приведенным в предыдущем примере..

              F из таблицы для 3 степеней свободы и 95% CL составляет 9,27. Расчетное значение F меньше чем из таблицы, поэтому вариацию внутри каждой популяции можно считать равной одинаковый.

            1. Выбросы
            2. При выполнении нескольких измерений некоторые значения могут необычно отличаться от других в наборе данных. Эти точки называются выбросы . Это всегда не легко определить по статистике, вызван ли выброс случайной ошибкой, присущей измерения или из-за какой-либо идентифицируемой ошибки. Всегда лучше тщательно искать по какой-либо причине, прежде чем измерение будет отброшено как выброс. Когда система или популяция малоизвестна, или когда на ней было сделано лишь несколько измерений, очень трудно определить с высокой степенью уверенности, что выброс действительно обусловлен ошибка, а не просто крайняя выборка в нормальном распределении.

              Например, десять повторных измерений (в мг/г) свинца в образца почвы: 1,0, 1,1, 1,2, 0,9, 1,0, 0,8, 1,0, 1,1, 0,9, 2,8. Последний число выглядит как выброс и может быть вызвано неисправностью прибора, человеческим фактором. ошибка или загрязнение. Одна из причин, по которой последнее измерение в приведенном выше наборе данных сразу считается выбросом, потому что он не соответствует нормальному распределению.

              1. Правило огромной ошибки
              2. Простой и быстрый метод определения того, можно ли отклонить выброс, состоит в том, чтобы разделить разница между заданным значением и средним по стандартному отклонению.

                .

                Если это отношение меньше 4, значение должно быть сохранено, когда s хорошо определенный. Если s было оценено только из нескольких измерений, значение 6 должно быть быть достигнуто до того, как его можно будет отбросить с доверительной вероятностью около 98%. Для данных выше, составляет 1,18 и s = 0,58. Соотношение составляет всего 2,1, поэтому последняя цифра не является выбросом в этом тесте.

              3. Тест Диксона на отклонение выбросов

              Тест Диксона основан на нормальном распределении ошибки. В этом тесте данные располагается в порядке возрастания числового значения: x 1 < x 2 < х 3 < ... < х n .

              Подозрительное значение может быть x n или x 1 . Отношение t рассчитывается следующим образом в зависимости от количества измерений.

        Для n = Если x n подозрительно

        Если x 1 подозрительно

        от 3 до 7

        т 10 =

        н н-1 )/(х н 1 )

        2 1 )/(х n 1 )

        от 8 до 10

        т 11 =

        н н-1 )/(х н 2 )

        2 1 )/(х n-1 1 )

        от 11 до 13

        т 21 =

        н н-2 )/(х н 2 )

        3 1 )/(х н-1 1 )

              Отношение сравнивается с критическими значениями из Табл. 5 при заданном уровне риска ложного отказа. Если рассчитанное отношение больше, чем табличное значение, значение может считаться выбросом при таком уровне риска.

            1. Отчетные данные
            2. Из приведенного выше обсуждения у вас должно сложиться впечатление, что простое сообщение о среднее значение не очень полезно для читателя. Как минимум, нужно сообщить среднее значение, стандартное отклонение и число степеней свободы или число измерения. В противном случае пользователь данных не сможет применить статистические тесты к данные. Доверие, которое пользователь может выразить в представленных данных, в основном описывается в информации, указанной в этих трех параметрах.

            3. Проверка гипотез

        Важно определить значимость или незначимость измерений потому что исследование окружающей среды обычно может быть предложено в качестве гипотезы. Полученные данные После того, как измерения выполнены, проверяются статистически, чтобы увидеть, верна ли гипотеза. доказано или нет. Какие виды гипотез можно проверить? Если вопрос “Это река загрязнена ПХБ?», гипотеза будет формулироваться как «Река содержит значительно более высокая концентрация ПХБ, чем в другой реке, которую мы считаем чистой (т. е. наш фоновый сайт)». В другом исследовании могут быть рассмотрены тесты система управления: «Является ли выброс SO 2 из этого стека слишком высоко?” Гипотезу можно сформулировать так: «Концентрация SO 2 в стеке стоки не значительно превышают концентрацию, указанную в отчетах компании. требование выпуска.” Обсужденные выше статистические тесты могут быть использованы для проверки этих гипотез, если собраны все необходимые данные — средства и стандартные отклонения как интересующей области, так и фона или стандарта, к которому она относится. сравнивается.

         

        Учебные вопросы

        1. Бензол присутствует в воздухе в количестве 10 частей на миллион по сравнению с . Выразите это в м г/л, в мг/м 3 .

        2. Ca +2 обнаружен в пробе воды на уровне 10 м г/литр. Сколько кальция в пересчете на карбонат кальция содержится в 1 м 3 воды?

        3. Каковы основные этапы процесса проведения анализа окружающей среды?

        4. Различать случайные и систематические ошибки. Что из этого можно лечить статистически?

        5. Объясните, как можно иметь высокую точность без высокой точности.

        6. Для следующего набора анализов пробы городского воздуха на угарный газ определяют среднее значение, стандартное отклонение, медиану и коэффициент вариации.
        325, 320, 334, 331, 280, 331, 338 м г/м 3 .

        7. Есть ли в приведенном выше наборе данных значение, которое можно отбросить как выброс?

        8. Образцы яиц птиц были проанализированы на наличие остатков ДДТ. Образцы были собраны из две разные среды обитания. Вопрос в том, отличаются ли две среды обитания друг от друга количество ДДТ, которому подвергаются эти птицы? Представленные данные:

        Зона сбора проб

        Количество образцов

        Средняя конц. ДДТ (частей на миллиард)

        Стандарт
        Отклонение(я)

        Зона 1

        4

        1,2

        0,33

        Зона 2

        6

        1,8

        0,12

        При 95% CL эти два набора существенно различаются или нет?

        9. Пробы почвы были отобраны в различных районах вокруг заброшенной шахты и анализируют на свинец. На каждом участке было отобрано несколько проб. Почва была извлечена с кислоты, а экстракт анализируют с помощью пламенной атомно-абсорбционной спектрометрии. Следующее получены данные:

        Зона Количество образцов Концентрация свинца в частях на миллион
        А 4 1,2, 1,0, 0,9, 1,4
        Б 5 0,7, 1,0, 0,5, 0,6, 0,4
        С 3 2,0, 2,2, 2,5
        Д 5 1,4, 1,1, 0,9, 1,7, 1,5
        Е 4 1,9, 2,3, 2,5, 2,5

        Рассчитать:
        а) Общее среднее значение всех измерений.
        d) Суммарная оценка стандартного отклонения метода
        c) 95% и 80% доверительный интервал для измерения в каждой точке.
        d) В каких из вышеперечисленных областей средние концентрации свинца незначительно отличаются друг от друга при 90% CL, что указывает на схожую картину загрязнения?

        10. Анализ сточных вод на бензол с использованием продувки и ловушки ГХ/МС дал объединенный стандартное отклонение 0,5 м г/л. Проба сточных вод из НПЗ показал концентрацию бензола 5,5 млн г/л. Рассчитайте доверительный интервал 75, 85, 95 и 99%, если указанная концентрация была на основе:
        a) одного анализа
        b) среднего значения 5 анализов
        c) среднего значения 15 анализов

        11. Различают следующие термины:
        а) Чувствительность и предел обнаружения
        b) Предел количественного определения и предел линейности
        c) Количественное определение по калибровочной кривой и методу добавления стандарта.
        d) Доверительный интервал и пределы доверительного интервала

        12. Следующие данные были получены при калибровке галоген-специфического ГХ-детектора. А линейная зависимость между откликом детектора в мВ и концентрацией дихлорэтана (DCE) ожидается. Анализ калибровочных стандартов дает следующие результаты:

        Концентрация ДХЭ, нг/мл Выход детектора, мВ

        1,0

        -54,0

        2.1

        -28,2

        3,05

        +2,8

        4,0

        +32,2

        5,05

        +65,8

         а) Нанесите данные калибровки и проведите линию через точки на глаз.

        b) Определить наилучшую прямую по методу наименьших квадратов

        c) Рассчитайте концентрацию неизвестного вещества, для которой выход детектора составил 7,8 мВ.

        d) Какова чувствительность калибровки?

        13. Следующие данные калибровки были получены для анализатора общего органического углерода. (TOC) измерение TOC в воде:

        Концентрация, мкг/л Количество повторов Средний сигнал Стандартное отклонение

        0,0

        20

        0,03

        0,008

        6,0

        10

        0,45

        0,0084

        10,0

        7

        0,71

        0,0072

        19,0

        5

        1,28

        0,015

        а) Рассчитать чувствительность калибровки

        б) Каков предел обнаружения для этого метода?

        c) Рассчитайте относительное стандартное отклонение для каждого набора повторов.

        Вернуться к главе

        Случайная ошибка

        Случайная ошибка

        Случайная ошибка

         


        По сути, цель эпидемиологического исследования состоит в том, чтобы измерить частоту заболевания или сравнить частоту заболевания в двух или более группах воздействия, чтобы измерить степень связи. Есть три основных проблемы для достижения точной оценки ассоциации:

        • Смещение
        • Смешение и
        • Случайная ошибка.

        Случайная ошибка возникает из-за того, что оценки, которые мы производим, основаны на выборках, а выборки могут неточно отражать то, что на самом деле происходит в популяции в целом. .

        Между различными дисциплинами существуют разные мнения относительно того, как концептуализировать и оценивать случайную ошибку. В этом модуле основное внимание будет уделено оценке точности оценок, полученных по выборкам.

         


        После успешного завершения этого раздела учащийся сможет:

        • Объясните влияние размера выборки на точность оценки
        • Определение и интерпретация 95% доверительных интервалов для показателей частоты и показателей связи
        • Определение и интерпретация p-значений
        • Обсудите распространенные ошибки в интерпретации мер случайной ошибки

         


        Рассмотрим два примера, в которых выборки должны использоваться для оценки некоторого параметра в совокупности:

        1. Предположим, я хочу оценить средний вес первокурсников, поступающих осенью в Бостонский университет, и выбираю первых пятерых первокурсников, которые согласны пройти взвешивание. Их средний вес составляет 153 фунта. Является ли это точной оценкой среднего значения для всего класса первокурсников? Интуитивно вы понимаете, что оценка может значительно отличаться, поскольку размер выборки очень мал и может не отражать среднее значение для всего класса. Кроме того, если бы я повторил этот процесс и взял несколько выборок из пяти студентов и вычислил среднее значение для каждой из этих выборок, я, вероятно, обнаружил бы, что оценки сильно отличаются друг от друга. Это также означает, что некоторые оценки очень неточны, то есть далеки от истинного среднего значения для класса.
        2. Предположим, у меня есть коробка с цветными шариками, и я хочу, чтобы вы оценили долю синих шариков, не заглядывая в коробку. Я встряхиваю коробку и позволяю вам выбрать 4 шарика и изучить их, чтобы вычислить долю синих шариков в вашей выборке. Опять же, вы интуитивно понимаете, что оценка может быть очень неточной, потому что размер выборки очень мал. Если бы вы повторили этот процесс и взяли несколько образцов из 4 шариков, чтобы оценить пропорцию синих шариков, вы, вероятно, обнаружили бы, что оценки сильно отличаются друг от друга, и многие из оценок были бы очень неточными.

        Оцениваемые параметры различались в этих двух примерах. Первой была измеряемая переменная, то есть масса тела, которая могла быть любой из бесконечного числа измерений на непрерывной шкале. Во втором примере шарики были либо голубого, либо другого цвета (т. е. дискретная переменная, которая может иметь только ограниченное число значений), и в каждом примере вычислялась частота появления синих шариков, чтобы оценить пропорцию из голубых мраморов. Тем не менее, хотя эти переменные относятся к разным типам, обе они иллюстрируют проблему случайной ошибки при использовании выборки для оценки параметра в совокупности.

        Проблема случайной ошибки возникает и в эпидемиологических исследованиях. Мы отметили, что основными целями эпидемиологических исследований являются: а) измерение частоты заболевания или б) сравнение измерений частоты заболевания в двух группах воздействия, чтобы измерить степень связи. Однако обе эти оценки могут быть неточными из-за случайной ошибки. Вот два примера, иллюстрирующие это.

        1. По большей части птичий грипп встречается только у птиц, но хорошо задокументировано, что люди, работающие в тесном контакте с птицами, могут заразиться этой болезнью. Предположим, мы хотим оценить вероятность смерти среди людей, заболевших птичьим гриппом. В этом случае нас не интересует сравнение групп для измерения ассоциации. Мы просто хотим иметь точную оценку того, как часто люди умирают от птичьего гриппа. Неизвестно, сколько людей заразились птичьим гриппом, но предположим, что исследователь в Гонконге выявил восемь случаев и подтвердил, что у них был птичий грипп, путем лабораторного тестирования. Четверо из восьми жертв умерли от болезни, а это означает, что частота летальных исходов (коэффициент летальности) составила 4/8 = 50%. Означает ли это, что 50% всех людей, зараженных птичьим гриппом, умрут? Насколько точна эта оценка?
        2. Предположим, исследователи хотят оценить связь между частым посещением загара и риском рака кожи. Проведено когортное исследование, в котором приняли участие 150 человек, которые часто загорают в течение года, и 124 человека, которые сообщили, что они ограничивают свое пребывание на солнце и регулярно используют солнцезащитный крем с SPF 15 или выше. По истечении десяти лет наблюдения отношение риска составляет 2,5, что позволяет предположить, что у тех, кто часто загорает, риск в 2,5 раза выше. Насколько точна эта оценка? Точно ли это отражает связь среди населения в целом?

         

        Безусловно, существует ряд факторов, которые могут снизить точность этих оценок. Возможны систематические ошибки, такие как предвзятость или смешение, которые могут сделать оценки неточными. Однако, даже если бы мы минимизировали систематические ошибки, возможно, что оценки могут быть неточными только из-за того, кто оказался в нашей выборке. Этот источник ошибки называется случайной ошибкой или ошибкой выборки.

        В примере с птичьим гриппом нас интересовала оценка доли в отдельной группе, т. е. доли смертей среди людей, инфицированных птичьим гриппом. В исследовании загара заболеваемость раком кожи была измерена в двух группах, и они были выражены в виде отношения, чтобы оценить степень связи между частым загаром и раком кожи. Когда оценка процента представляет собой одно значение (например, пропорция в первом примере и отношение риска во втором), это называется балльная оценка . Для обеих этих точечных оценок можно использовать доверительный интервал, чтобы указать его точность.

         

         

         


        Строго говоря, 95-процентный доверительный интервал означает, что если одна и та же совокупность будет отобрана бесконечное количество раз и для каждого случая будут сделаны оценки доверительного интервала, результирующие интервалы будут содержать истинный параметр совокупности примерно через 95% случаев при условии отсутствия систематической ошибки (предвзятости или смешения). Однако, поскольку мы не отбираем одну и ту же популяцию и не проводим одно и то же исследование в многочисленных (гораздо менее бесконечных) случаях, нам нужна интерпретация одного доверительного интервала. Интерпретация оказывается на удивление сложной, но для целей нашего курса мы скажем, что она имеет следующую интерпретацию: доверительный интервал — это диапазон вокруг точечной оценки, внутри которого, вероятно, находится истинное значение с определенной вероятности при условии отсутствия систематической ошибки (предвзятости или смешения). Если размер выборки мал и подвержен большему количеству случайных ошибок, то оценка будет не такой точной, а доверительный интервал будет широким, что указывает на большее количество случайных ошибок. Напротив, при большом размере выборки ширина доверительного интервала уже, что указывает на меньшую случайную ошибку и большую точность. Следовательно, можно использовать ширину доверительных интервалов, чтобы указать величину случайной ошибки в оценке. Наиболее часто используемые доверительные интервалы определяют либо 9Вероятность 5% или 90%, хотя можно рассчитать интервалы для любого уровня от 0 до 100%. Доверительные интервалы также могут быть рассчитаны для многих точечных оценок: средних значений, долей, показателей, отношений шансов, отношений рисков и т. д. В этом курсе мы будем в основном использовать 95% доверительные интервалы для а) доли в одной группе и б) для оценочные меры ассоциации (отношения рисков, отношения скоростей и отношения шансов), которые основаны на сравнении двух групп.

        Важно отметить, что 95% доверительные интервалы учитывают только случайные ошибки и не учитывают известные или неизвестные систематические ошибки или искажения, которые неизменно возникают в эпидемиологических исследованиях. Следовательно, Ротман предупреждает, что лучше рассматривать доверительные интервалы как общее руководство по количеству случайных ошибок в данных. Неучет того факта, что доверительный интервал не учитывает систематическую ошибку, является обычным явлением и приводит к неправильной интерпретации результатов исследований.

        Доверительный интервал для пропорции

        В приведенном выше примере, в котором меня интересовала оценка летальности среди людей, инфицированных птичьим гриппом, я имел дело только с одной группой, т. е. не проводил никаких сравнений. Лай и др. провел поиск литературы в 2007 году и обнаружил в общей сложности 170 случаев человеческого птичьего гриппа, о которых сообщалось в литературе. Среди них было 92 случая смерти, что означает, что общий уровень летальности составил 92/170 = 54%. Насколько точна эта оценка?

        Ссылка на статью Lye et al.

        Существует несколько методов вычисления доверительных интервалов, некоторые из них более точны и универсальны, чем другие. Электронная таблица EpiTool.XLS, созданная для этого курса, содержит рабочий лист под названием «CI — One Group», который будет вычислять доверительные интервалы для точечной оценки в одной группе. В верхней части рабочего листа вычисляются доверительные интервалы для пропорций, таких как распространенность или кумулятивная заболеваемость, а в нижней части вычисляются доверительные интервалы для уровня заболеваемости в отдельной группе.

        Краткий видеотур по “Epi_Tools.XLSX” (9:54)

        Ссылка на расшифровку видео

        Электронные таблицы

        — ценный профессиональный инструмент. Чтобы узнать больше об основах использования Excel или Numbers для приложений общественного здравоохранения, см. модуль онлайн-обучения по номеру

        . Ссылка на модуль онлайн-обучения по использованию электронных таблиц — Excel (ПК) и Numbers (Mac и iPad)

         

        Используйте “Epi_Tools” для вычисления 95% доверительный интервал для общей летальности от птичьего гриппа, о котором сообщают Lye et al. (ПРИМЕЧАНИЕ. Вам следует загрузить электронную таблицу Epi-Tools на свой компьютер; также есть ссылка на EpiTools в разделе «Узнать больше» в левой части страницы.) Откройте Epi_Tools.XLSX и вычислите достоверность 95%; затем сравните свой ответ с приведенным ниже.

        ОТВЕТ

         

         

        Как бы вы интерпретировали этот доверительный интервал в одном предложении? Запишите свою интерпретацию, прежде чем смотреть ответ.

        ОТВЕТ

                   

        В серии гипотетических случаев, которая была описана на второй странице этого модуля, сценарий описывал 8 случаев птичьего гриппа у людей, и 4 из них умерли. используйте Epi_Tools для вычисления 95% доверительного интервала для этой пропорции. Как этот доверительный интервал сравнивается с тем, который вы вычислили на основе данных, представленных Lye et al.?

        ОТВЕТ

         

        Ключом к уменьшению случайной ошибки является увеличение размера выборки. Таблица ниже иллюстрирует это, показывая 95% доверительные интервалы, которые будут получены для точечных оценок 30%, 50% и 60%. Для каждого из них в таблице показано, каким будет 95% доверительный интервал при увеличении размера выборки с 10 до 100 или до 1000. Как видите, доверительный интервал существенно сужается по мере увеличения размера выборки, отражая меньшую случайную ошибку и большую точность.

        Наблюдаемая частота

        Размер выборки =10

        Размер выборки =100

        Размер выборки = 1000

        0,30

        0,11 – 0,60

        0,22 – 0,40

        0,27 – 0,33

        0,50

        0,24 – 0,76

        0,40 – 0,60

        0,47 – 0,53

        0,60

        0,31 – 0,83

        0,50 – 0,69

        0,57 – 0,63

         

         

        Резюме видео — доверительный интервал для доли в одной группе (5:11)

        Ссылка на расшифровку видео

         


        Показатели взаимосвязи рассчитываются путем сравнения двух групп и расчета отношения рисков, разницы рисков (или отношений показателей и различий показателей) или, в случае исследования случай-контроль, отношения шансов. Эти типы точечных оценок суммируют величину связи с одним числом, которое фиксирует частоты в обеих группах. Эти точечные оценки, конечно, также подвержены случайной ошибке, и можно указать степень точности этих оценок, вычислив для них доверительные интервалы.

        Существует также несколько методов вычисления доверительных интервалов для оценочных показателей связи. Вы не будете нести ответственность за эти формулы; они представлены так, что вы можете видеть компоненты доверительного интервала.

        , где «RR» — отношение риска, «a» — количество событий в группе, подвергшейся воздействию, «N 1 » — количество субъектов в группе, подвергшейся воздействию, «c» — количество событий в группе, не подвергшейся воздействию. группа и N 0 — количество субъектов в неэкспонированной группе.


        , где IRR — коэффициент заболеваемости, «a» — количество событий в группе, подвергшейся воздействию, а «b» — количество событий в группе, не подвергавшейся воздействию.


        , где «ИЛИ» — отношение шансов, «а» — количество случаев в группе, подвергшейся воздействию, «b» — количество случаев в группе, не подвергавшейся воздействию, «с» — количество контролей в группе, подвергшейся воздействию, и «d» — количество контролей в неэкспонированной группе.

        Интерпретация 95% доверительного интервала для отношения шансов или отношения риска

        Как отмечалось ранее, 95% доверительный интервал означает, что если одна и та же популяция отбиралась несколько раз и в каждом случае делались оценки доверительного интервала, результирующие интервалы содержали бы истинный параметр популяции примерно в 95% случаев, при условии, что не было никаких предубеждений или путаницы. Однако люди обычно применяют эту вероятность к одному исследованию. Следовательно, отношение шансов 5,2 с доверительным интервалом от 3,2 до 7,2 предполагает, что существует 95% вероятность того, что истинное отношение шансов, вероятно, будет лежать в диапазоне 3,2–7,2 при условии отсутствия смещения или смешения . Интерпретация 95-процентного доверительного интервала для отношения рисков, отношения скоростей или разницы рисков будет аналогичной.


        Проверка гипотез (или определение статистической значимости) остается доминирующим подходом к оценке роли случайной ошибки, несмотря на множество критических замечаний по поводу его неадекватности за последние два десятилетия. Хотя среди эпидемиологов он не так популярен, он обычно без исключения используется в других областях исследований в области здравоохранения. Многие эпидемиологи считают, что нашей целью должна быть оценка, а не тестирование. Согласно этой точке зрения, проверка гипотез основана на ложной предпосылке: цель обсервационного исследования состоит в том, чтобы принять решение (отклонить или принять), а не внести определенный вес доказательств в более широкое исследование конкретного контактного заболевания. гипотеза. Кроме того, идея отсечки для ассоциации теряет всякий смысл, если серьезно отнестись к оговорке о том, что меры случайной ошибки не учитывают систематическую ошибку, поэтому проверка гипотезы основана на вымысле о том, что наблюдаемое значение было измерено без смещения или искажения. , которые на самом деле присутствуют в большей или меньшей степени в каждом исследовании.

        Одних только доверительных интервалов должно быть достаточно, чтобы описать случайную ошибку в наших данных, а не использовать отсечение для определения наличия связи. Независимо от того, принимается проверка гипотез или нет, важно понимать ее, поэтому концепция и процесс описаны ниже вместе с некоторыми из распространенных тестов, используемых для категориальных данных.

        Когда группы сравниваются и обнаруживаются различия, возможно, что наблюдаемые различия были просто результатом случайной ошибки или изменчивости выборки. Проверка гипотез включает в себя проведение статистических тестов для оценки вероятности того, что наблюдаемые различия были вызваны просто случайной ошибкой. Ашенграу и Сидж отмечают, что проверка гипотез состоит из трех основных этапов:

        1) Выделяют “нулевую” и “альтернативную” гипотезы. Нулевая гипотеза состоит в том, что группы не различаются. Другие способы формулировки нулевой гипотезы следующие:

        • Показатели заболеваемости одинаковы для обеих групп.
        • Отношение риска = 1,0, или отношение скорости = 1,0, или отношение шансов = 1,0
        • Разница рисков = 0 или атрибутивная доля = 0

        2) Сравниваются результаты, ожидаемые при нулевой гипотезе, с фактическими наблюдаемыми результатами, чтобы определить, согласуются ли наблюдаемые данные с нулевой гипотезой. Эта процедура проводится с одним из многих статистических тестов. Конкретный используемый статистический тест будет зависеть от плана исследования, типа измерений и от того, являются ли данные нормально распределенными или искаженными.

        3) Принимается решение, следует ли отклонить нулевую гипотезу и принять вместо нее альтернативную гипотезу. Если вероятность того, что наблюдаемые различия являются результатом изменчивости выборки, очень мала (обычно меньше или равна 5%), то можно сделать вывод, что различия были «статистически значимыми», и это подтверждает вывод о наличии связи (хотя необходимо учитывать предвзятость и путаницу, прежде чем сделать вывод о наличии достоверной связи).


        Конечным результатом статистического теста является “значение p”, где “p” указывает вероятность наблюдения различий между группами, которые являются большими или большими, если бы нулевая гипотеза была верна. Логика такова, что если вероятность увидеть такую ​​разницу как результат случайной ошибки очень мала (большинство людей использует p<0,05 или 5%), то группы, вероятно, разные. [ПРИМЕЧАНИЕ: если p-значение> 0,05, это не означает, что вы можете сделать вывод, что группы не отличаются; это просто означает, что у вас нет достаточных доказательств, чтобы отвергнуть нулевую гипотезу. К сожалению, даже это различие обычно теряется на практике, и очень часто результаты сообщаются так, как будто существует связь, если p<0,05, и отсутствие связи, если p>0,05. Только в мире проверки гипотез вероятность того, что нулевая гипотеза верна, составляет 10-15% (или 85-90% вероятность того, что это неправда) считается свидетельством против ассоциации.]

        Чаще всего p <  0,05 является «критическим значением» или критерием статистической значимости. Однако этот критерий условен. Значение p, равное 0,04, указывает на 4%-ную вероятность увидеть такие большие различия из-за изменчивости выборки, а p-значение 0,06 указывает на вероятность 6%. Хотя они не так уж и отличаются, один из них будет считаться статистически значимым, а другой — нет, если вы строго придерживаетесь p = 0,05 в качестве критерия для оценки значимости результата.

        Резюме видео: нулевая гипотеза и P-значения (11:19)

        Ссылка на расшифровку видео

        Тест хи-квадрат

        Тест хи-квадрат является широко используемым статистическим тестом при сравнении частот, например, кумулятивных случаев. Для каждой ячейки в таблице непредвиденных обстоятельств вычитается ожидаемая частота из наблюдаемой частоты, возводится результат в квадрат и делится на ожидаемое число. Результаты для четырех ячеек суммируются, и результатом является значение хи-квадрат. Можно использовать значение хи-квадрат, чтобы найти в таблице «p-значение» или вероятность увидеть такие большие различия случайно. Для любого заданного значения хи-квадрат соответствующее значение p зависит от количества степеней свободы. Если у вас есть простая таблица 2×2, у вас есть только одна степень свободы. Это означает, что в таблице непредвиденных обстоятельств 2×2, учитывая, что поля известны, знания числа в одной ячейке достаточно, чтобы вывести значения в других ячейках.

        Формула для статистики хи-квадрат:

        Затем можно найти соответствующее значение p, основанное на значении хи-квадрата и степенях свободы, в таблице распределения хи-квадрата. Электронные таблицы Excel и статистические программы имеют встроенные функции для нахождения соответствующего значения p из распределения хи-квадрат. значение будет 0,13, что означает 13% шанс увидеть разницу в частоте больше или больше, если нулевая гипотеза верна.

        Тест

        хи-квадрат также может быть выполнен с более чем двумя строками и двумя столбцами. В общем, количество степеней свободы равно количеству строк минус один, умноженному на количество столбцов минус один, т. е. степень свободы (df) = (r-1)x(c-1). Вы должны указать степени свободы при поиске p-значения.

        Использование Excel: электронные таблицы Excel имеют встроенные функции, которые позволяют вычислять p-значения с помощью критерия хи-квадрат. В файле Excel «Epi_Tools.XLS» есть рабочий лист, посвященный тесту хи-квадрат и иллюстрирующий, как использовать Excel для этой цели. Также обратите внимание, что этот метод используется в рабочих листах, которые рассчитывают p-значения для исследований случай-контроль и для когортных исследований.

        Точный тест Фишера

        Хи-квадрат использует процедуру, предполагающую довольно большой размер выборки. При небольших размерах выборки критерий хи-квадрат дает ложно низкие p-значения, которые преувеличивают значимость результатов. В частности, когда ожидаемое количество наблюдений при нулевой гипотезе в любой ячейке таблицы 2×2 меньше 5, критерий хи-квадрат преувеличивает значимость. В этом случае предпочтительнее использовать точный критерий Фишера .

        Точный критерий Фишера основан на большой итерационной процедуре, недоступной в Excel. Однако очень простая в использовании таблица 2×2 для точного критерия Фишера доступна в Интернете по адресу http://www.langsrud.com/fisher.htm. На приведенном ниже снимке экрана показано использование точного теста Фишера в режиме онлайн для расчета p-значения для исследования случайных аппендэктомий и раневых инфекций. Когда я использовал критерий хи-квадрат для этих данных (неуместно), он дал p-значение = 0,13. Те же данные дали p = 0,26, когда использовался точный критерий Фишера.

         

         

         


        Доверительные интервалы рассчитываются по тем же уравнениям, которые генерируют p-значения, поэтому неудивительно, что между ними существует взаимосвязь, и доверительные интервалы для показателей связи часто используются для решения вопроса о «статистической значимости», даже если p-значение не рассчитывается. Мы уже отмечали, что один из способов сформулировать нулевую гипотезу — это заявить, что отношение риска или отношение шансов равно 1,0. Мы также отметили, что точечная оценка является наиболее вероятным значением, основанным на наблюдаемых данных, а 95% доверительный интервал количественно определяет случайную ошибку, связанную с нашей оценкой, и его также можно интерпретировать как диапазон, в котором истинное значение, вероятно, находится с 95% уверенностью. Это означает, что значения за пределами доверительного интервала 95% вряд ли будут истинными значениями. Следовательно, если нулевое значение (RR=1,0 или OR=1,0) не содержится в пределах 95% доверительного интервала, то вероятность того, что нулевое значение является истинным значением, меньше 5%. И наоборот, если ноль содержится в 95% доверительный интервал, то нуль является одним из значений, которое согласуется с наблюдаемыми данными, поэтому нулевая гипотеза не может быть отвергнута.

        ПРИМЕЧАНИЕ: Такое использование, на мой взгляд, неудачно, потому что оно, по существу, использует доверительный интервал для принятия решения о принятии/отклонении, а не фокусируется на нем как на мере точности, и оно фокусирует все внимание на одной стороне двух односторонний показатель (например, если верхний и нижний пределы доверительного интервала равны 0,90 и 2,50, вероятность того, что истинный результат будет 2,50, столь же велика, как и 0,90).

        Простой способ запомнить взаимосвязь между доверительным интервалом 95 % и значением p, равным 0,05, состоит в том, чтобы думать о доверительном интервале как о плечах, которые «охватывают» значения, согласующиеся с данными. Если нулевое значение «охвачено», то оно, безусловно, не отклонено , т. е. p-значение должно быть больше 0,05 (не является статистически значимым), если нулевое значение находится в пределах интервала. Однако, если 95% ДИ исключает нулевое значение, тогда нулевая гипотеза отклонена , а p-значение должно быть < 0,05.

        Резюме видео: доверительные интервалы для отношения рисков, отношения шансов и отношения ставок (8:35)

        Ссылка на расшифровку видео


        С «незначимыми» результатами

        Разница между перспективой, обеспечиваемой доверительным интервалом, и проверкой значимости особенно очевидна при рассмотрении незначимых результатов. На изображении ниже показаны два доверительных интервала; ни один из них не является «статистически значимым» по критерию P < 0,05, потому что оба они содержат нулевое значение (коэффициент риска = 1,0). Однако следует рассматривать эти две оценки по-разному. Оценка с широким доверительным интервалом, вероятно, была получена при небольшом размере выборки и большом потенциале случайной ошибки. Однако, несмотря на то, что это не является статистически значимым, точечная оценка (т. е. предполагаемое отношение риска или отношение шансов) была где-то около четырех, что повышает вероятность важного эффекта. В этом случае можно было бы захотеть изучить это дальше, повторив исследование с большим размером выборки. Повторение исследования с большей выборкой, конечно, не гарантирует статистически значимый результат, но дает более точную оценку. Другая изображенная оценка также незначительна, но она гораздо более узкая, т. е. более точная оценка, и мы уверены, что истинное значение, вероятно, будет близко к нулевому значению. Даже если между группами и была разница, скорее всего, это была очень небольшая разница, которая могла бы иметь небольшое клиническое значение, если оно вообще имело бы какое-либо значение. Таким образом, в этом случае никто не будет склонен к повторению исследования.

        Например, даже если бы было проведено масштабное исследование, которое показало бы отношение риска 1,03 с 95% доверительным интервалом 1,02–1,04, это указывало бы на увеличение риска только на 2–4%. Даже если бы это было правдой, это не имело бы значения, и вполне могло бы быть результатом предубеждений или остаточного смешения. Следовательно, узкий доверительный интервал обеспечивает убедительные доказательства того, что связь незначительна или отсутствует.

        со «значительными» результатами

        На следующем рисунке показаны результаты двух исследований, оба из которых статистически значимы при P < 0,05, поскольку оба доверительных интервала полностью лежат выше нулевого значения (RR или OR = 1). Верхний результат имеет точечную оценку около двух, а его доверительный интервал находится в диапазоне от примерно 0,5 до 3,0, а нижний результат показывает точечную оценку около 6 с доверительным интервалом в диапазоне от 0,5 до примерно 12. Более узкий и точный оценка позволяет нам быть уверенными в том, что существует примерно двукратное увеличение риска среди тех, кто подвергается интересам. Напротив, исследование с широким доверительным интервалом является «статистически значимым», но оставляет нас неуверенными в величине эффекта. Является ли увеличение риска относительно скромным или огромным? Мы просто не знаем.

        Таким образом, независимо от того, соответствуют ли результаты исследования критерию статистической значимости, более важным соображением является точность оценки.

           

          


        Aschengrau и Seage отмечают, что проверка гипотез была разработана для облегчения принятия решений в сельскохозяйственных экспериментах и ​​впоследствии стала использоваться в биомедицинской литературе как средство установления стандартов для принятия решений. Р-значения стали повсеместными, но эпидемиологи все больше осознают ограничения и злоупотребления р-значениями, и, хотя принятие решений на основе фактических данных важно в общественном здравоохранении и медицине, решения редко принимаются на основе обнаружения единственного исследование.

        1. Независимо от того, преднамеренно или нет, p-значения имеют тенденцию превращаться в вывод «значимый» или «незначимый» в зависимости от того, меньше или равно p-значение 0,05. Это может ввести в заблуждение.
        2. P-значения зависят как от степени связи, так и от точности оценки (размера выборки). Если величина эффекта мала и клинически незначительна, значение p может быть «значимым», если размер выборки велик. И наоборот, эффект может быть большим, но не соответствовать критерию p<0,05, если размер выборки мал.
        3. Возникает соблазн отправиться в «рыболовные экспедиции», в ходе которых исследователи проверяют множество возможных ассоциаций. Когда проверяется множество возможных ассоциаций с использованием критерия p < 0,05, вероятность нахождения хотя бы одной, удовлетворяющей критической точке, возрастает пропорционально числу проверяемых ассоциаций.
        4. Многие исследователи ошибочно полагают, что p-значение представляет вероятность того, что нулевая гипотеза верна. Однако p-значения вычисляются на основе предположения, что нулевая гипотеза верна. Р-значение — это вероятность того, что данные могут отклоняться от нулевой гипотезы так же или даже больше. Следовательно, p-значение измеряет совместимость данных с нулевой гипотезой, а не вероятность того, что нулевая гипотеза верна.
        5. Статистическая значимость не учитывает оценку систематической ошибки и смешения.

         

        Таблица 12-2 в учебнике Ашенграу и Сиджа представляет собой хорошую иллюстрацию некоторых ограничений p-значений.

        Результаты пяти гипотетических исследований риска развития рака молочной железы после воздействия табачного дыма в детстве

        (Адаптировано из Таблицы 12-2 в Aschengrau и Seage)

        Исследование

        # Субъекты

        Относительный риск

        значение р

        «Статистически значимый»

        А

        2500

        1,4

        0,02

        Да

        Б

        500

        1,7

        0,10

        С

        2000

        1,6

        0,04

        Да

        Д

        250

        1,8

        0,30

        Е

        1000

        1,6

        0,06

        Авторы исходят из предположения, что эти пять гипотетических исследований составляют всю доступную литературу по этому вопросу и что все они свободны от предвзятости и путаницы. Авторы отмечают, что относительные риски в совокупности и последовательно предполагают умеренное увеличение риска, однако p-значения непоследовательны в том смысле, что два имеют «статистически значимые» результаты, а три – нет. В этом примере мера ассоциации дает наиболее точную картину наиболее вероятной связи. Значение p является скорее мерой «стабильности» результатов, и в этом случае, когда степень связи между исследованиями одинакова, более крупные исследования обеспечивают большую стабильность.

        Видео: Просто для развлечения: что такое р-значение?


        ПРИМЕЧАНИЕ. Этот раздел является необязательным; вас не будут тестировать на этом

        Вместо того, чтобы просто проверять нулевую гипотезу и использовать p < 0,05 в качестве жесткого критерия статистической значимости, потенциально можно рассчитать p-значения для ряда других гипотез. По сути, рисунок справа показывает результаты исследования связи между случайной аппендэктомией и риском инфицирования послеоперационной раны. В этом исследовании приняли участие 210 человек, и коэффициент риска был равен 4,2. Тест хи-квадрат дал значение p 0,13, а точный критерий Фишера дал значение p 0,26, что «не является статистически значимым». Однако для многих людей это подразумевает отсутствие связи между воздействием и результатом.

        На приведенном ниже графике представлена ​​более полная статистическая взаимосвязь между воздействием и исходом. Пик кривой показывает RR=4,2 (точечная оценка). В некотором смысле эта точка на пике проверяет нулевую гипотезу о том, что RR = 4,2, а наблюдаемые данные имеют точечную оценку 4,2, поэтому данные ОЧЕНЬ совместимы с этой нулевой гипотезой, а p-значение равно 1,0. При движении по горизонтальной оси кривая суммирует статистическую связь между воздействием и результатом для бесконечного числа гипотез.

        Каждая из трех горизонтальных синих линий, обозначенных как 80%, 90% и 95%, пересекает кривую в двух точках, которые обозначают произвольные доверительные интервалы 80, 90 и 95% для точечной оценки. Если мы рассмотрим нулевую гипотезу о том, что RR = 1, и сосредоточимся на горизонтальной линии, указывающей 95% достоверность (т. Е. Значение p = 0,05), мы увидим, что нулевое значение содержится в пределах доверительного интервала. Также обратите внимание, что кривая пересекает вертикальную линию для нулевой гипотезы RR=1 при значении p около 0,13 (которое было значением p, полученным из теста хи-квадрат).

        Однако, если мы сосредоточимся на горизонтальной линии, помеченной как 80%, мы увидим, что нулевое значение находится за пределами кривой в этой точке. Другими словами, мы на 80% уверены, что истинный коэффициент риска находится в диапазоне RR от 1 до примерно 25.

        Выше мы отметили, что p-значения зависят как от величины связи, так и от точности оценки (на основе размера выборки), но p-значение само по себе не передает смысл этих компонентов по отдельности; для этого вам нужна как точечная оценка, так и распространение доверительного интервала. Приведенная выше функция p-значения прекрасно суммирует статистическую взаимосвязь между воздействием и результатом, но это необязательно делать, чтобы получить четкое представление о взаимосвязи.

Добавить комментарий

Ваш адрес email не будет опубликован.