Методы измерений гост: ГОСТ Р 8.563-2009. Государственная система обеспечения единства измерений. Методики (методы) измерений | Библиотека

Содержание

ГОСТ Р 8.563-2009. Государственная система обеспечения единства измерений. Методики (методы) измерений | Библиотека

  • 7 февраля 2022 г. в 11:26
  • 1
  • Поделиться

  • Пожаловаться

ГОСТ Р 8.563-2009. Государственная система обеспечения единства измерений. Методики (методы) измерений

Государственная система обеспечения единства измерений. Методики (методы) измерений

Предисловие

Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. № 184-ФЗ «О техническом регулировании», а правила применения национальных стандартов Российской Федерации — ГОСТ Р 1.0-2004 «Стандартизация в Российской Федерации. Основные положения»

Сведения о стандарте

1. РАЗРАБОТАН Федеральным государственным унитарным предприятием «Всероссийский научно-исследовательский институт метрологической службы» (ФГУП «ВНИИМС»).

2. ВНЕСЕН Управлением метрологии Федерального агентства по техническому регулированию и метрологии.

3. УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 15 декабря 2009 г. № 1253-ст.

4. ВЗАМЕН ГОСТ Р 8.563-96.

5. ПЕРЕИЗДАНИЕ. Март 2011 г.

Введение

Требования к методикам (методам) измерений в Российской Федерации установлены статьей 5 Федерального закона от 26 июня 2008 г. № 102-ФЗ «Об обеспечении единства измерений» (далее — Федеральный закон «Об обеспечении единства измерений»), в соответствии с которой аттестации подлежат методики (методы) измерений, используемые в сфере государственного регулирования обеспечения единства измерений.

Сфера государственного регулирования обеспечения единства измерений в соответствии с положениями частей 3 и 4 статьи 1 Федерального закона «Об обеспечении единства измерений» распространяется на измерения, к которым установлены обязательные требования, и измерения, предусмотренные законодательством Российской Федерации о техническом регулировании.

Перечни измерений с установленными к ним обязательными требованиями формируются в соответствии с частью 2 статьи 27 Федерального закона «Об обеспечении единства измерений».

Настоящий стандарт разработан в целях изложения рекомендаций по реализации установленных статьей 5 Федерального закона «Об обеспечении единства измерений» требований к методикам (методам) измерений.

1 Область применения

Настоящий стандарт распространяется на методики и методы измерений (далее — методики измерений), включая методики количественного химического анализа (далее — МКХА), и устанавливает общие положения и требования, относящиеся к разработке, аттестации, стандартизации, применению методик измерений и метрологическому надзору за ними.

Стандарт не распространяется на методики измерений, предназначенные для выполнения прямых измерений, т.е. методики, в соответствии с которыми искомое значение величины получают непосредственно от средства измерений. Такие методики измерений вносят в эксплуатационную документацию на средства измерений. Подтверждение соответствия этих методик обязательным метрологическим требованиям осуществляется в процессе утверждения типов данных средств измерений.

Скачать ГОСТ Р 8.563-2009

×
  • ВКонтакте
  • Однокласники
  • Facebook
  • Twitter
  • Telegram
  • Pinterest

Разработка и аттестация методик (методов) измерений

Метрологическая служба ФБУ «Красноярский ЦСМ» (далее по тексту – Центр) в области обеспечения единства измерений по аттестации методик (методов) измерений аккредитована и внесена в реестр аккредитованных лиц 13 июля 2015 года, аттестат аккредитации № RA.RU.311212.  

Целью любого измерения является получение действительного значения измеряемой физической величины (ФВ), то есть такого значения, которое достоверно представляло бы истинное значение измеряемой ФВ. Точность измерений является необходимым условием для использования результатов измерений. Несоблюдение этого условия делает невозможным получение действительного значения измеряемой ФВ.

Обеспечение точности измерений заключается в выполнении следующего соотношения предела допускаемой погрешности измерений (Δдоп) и значения предела реализуемой в ходе измерений погрешности (Δизм): Δизм ≤ Δдоп.

Запас точности измерений (избыточная точность) как правило оказывается нерациональным, поскольку предельное соотношение Δизм = Δдоп обеспечивает достоверность измерительной информации, а уменьшение погрешности измерений ведет к резкому росту затрат на их выполнение.  

При разработке методик (методов) измерений или при метрологической экспертизе проекта документа на методику измерений специалисты Центра окажут помощь:

  • в исследовании требований и определении процедуры проведения измерений;
  • в выборе оптимальных средств измерений (СИ) и оценке параметров режимов их работы;
  • в разработке методов и средств поверки (калибровки) используемых СИ;
  • в разработке методов контроля точности измерений.

Процедура аттестации методик  измерений (МВИ) в ФБУ «Красноярский ЦСМ» включает следующие этапы:

  • рассмотрение заявки на аттестацию МВИ;
  • оформление договора на аттестацию МВИ;
  • аттестацию МВИ;
  • оформление результатов аттестации.

Основанием для проведения работ по аттестация МВИ служит обращение заявителя, поступившее в Центр в виде письма произвольной формы либо заявки по форме, приведенной на сайте.

К заявке прилагаются следующие документы:

  • исходные требования (техническое задание) на разработку МВИ, в том числе требования к точности измерений и условиям измерений;
  • документ (проект документа), регламентирующий МВИ;
  • программа и результаты экспериментального или расчетного оценивания характеристик погрешности измерений, если оно проводилось при разработке МВИ.

Аттестацию МВИ осуществляют на основе результатов метрологической экспертизы комплекта документов на МВИ с использованием рекомендаций Р 50.2.008-2001 и РМГ 63-2003, включающих материалы теоретического и (или) экспериментального исследования МВИ, подтверждающих соответствие МВИ требованиям нормативно-правовых документов в области обеспечения единства измерений.

При проведении метрологической экспертизы материалов теоретических и (или) экспериментальных исследований и способов экспериментальной оценки характеристик погрешности, МВИ подвергают анализу представления характеристик погрешности, соответствие способов представления неопределенности.   

Для МВИ состава и свойств веществ и материалов (МКХА) проверяют также их соответствие основным положениям ГОСТ Р ИСО 5725-1 ÷ ГОСТ Р ИСО 5725-4. В части предложенных процедур контроля точности получаемые результаты измерений анализируют по ГОСТ Р ИСО 5725-6.  

При экспертизе документа на МВИ оценивают подтверждение соответствия:

  • методики измерений – свойствам объекта измерения и характеру измеряемых величин;
  • условий выполнения измерений – требованиям к применению данной МВИ, в том числе проверяют утверждение типов средств измерений по Государственному реестру средств измерений;
  • показателей точности результатов измерений и способов обеспечения достоверности измерений – установленным метрологическим требованиям;
  • используемым в МВИ СИ и СО – условиям обеспечения прослеживаемости результатов измерений к государственным первичным эталонам единиц величин – национальным эталонам единиц величин иностранных государств;
  • записи результатов измерений – требованиям к единицам величин, допущенным к применению в РФ.

При положительных результатах аттестации МВИ, применяемой в сфере распространения государственного метрологического контроля и надзора оформляют свидетельство об аттестации МВИ по форме, приведенной ниже. Для остальных МВИ свидетельство об аттестации оформляют по требованию заказчика.

Специалисты ФБУ «Красноярский ЦСМ» имеют достаточный научный потенциал, опыт решения задач по количественному химическому анализу, охране окружающей среды, учету электроэнергии, нефтепродуктов и газов и других для успешного сотрудничества по направлению аттестации методик (методов) измерений.

 

ГОСТ Р 8.563-96 Государственная система обеспечения единства измерений (ГСИ). Методики выполнения измерений (с Изменениями N 1, 2)

ПРИЛОЖЕНИЕ В (рекомендуемое). Построение и изложение отдельных документов по МВИ

ПРИЛОЖЕНИЕ В
(рекомендуемое)

        
Построение и изложение отдельных документов на МВИ

В.1 Наименование документа на МВИ должно соответствовать требованиям ГОСТ Р 1.5. Допускается отражать в наименовании специфику измерений величины. Например: “ГОСУДАРСТВЕННАЯ СИСТЕМА ОБЕСПЕЧЕНИЯ ЕДИНСТВА ИЗМЕРЕНИЙ. МАССА ГРУЗОВ, ПЕРЕВОЗИМЫХ ПО ЖЕЛЕЗНОЙ ДОРОГЕ. Методика выполнения измерений большегрузными платформенными весами”.

При большом числе измеряемых величин применяют их обобщенное наименование, например: “ПАРАМЕТРЫ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ В РАСКРЫВЕ ОСТРОНАПРАВЛЕННЫХ АНТЕНН”.

В.2 Документ на МВИ должен содержать вводную часть и следующие разделы:

– требования к погрешности измерений или приписанные характеристики погрешности измерений;

– средства измерений, вспомогательные устройства, материалы, растворы;

– метод (методы) измерений;

– требования безопасности, охраны окружающей среды;

– требования к квалификации операторов;

– условия измерений;

– подготовка к выполнению измерений;

– выполнение измерений;

– обработка (вычисление) результатов измерений;

– контроль погрешности результатов измерений;

– оформление результатов измерений.

Допускается исключать или объединять указанные разделы или изменять их наименования, а также включать дополнительные разделы с учетом специфики измерений.

В.3 Вводная часть устанавливает назначение и область применения документа на МВИ.

В.3.1 Вводную часть излагают в следующей редакции: “Настоящий документ (указывают конкретно вид документа на МВИ) устанавливает методику выполнения измерений (далее – наименование измеряемой величины, в необходимых случаях с указанием ее специфики и специфики измерений)”.

В.3.2 При ссылке на конкретную продукцию в вводной части указывают обозначение нормативного документа, распространяющегося на эту продукцию, например: “Настоящий документ (указывают конкретный вид документа на МВИ) устанавливает методики выполнения измерений при определении характеристик магнитомягких сплавов по ГОСТ 10160 в любой точке петли гистерезиса. К числу характеристик магнитомягких сплавов относят:

– коэрцитивную силу по индукции;

– коэффициент прямоугольности петли гистерезиса;

– коэрцитивную силу по намагниченности;

– температурные коэффициенты вышеперечисленных характеристик”.

В.4 Раздел “Требования к погрешности измерений” или “Характеристики погрешности измерений” содержит числовые значения требуемых или приписанных характеристик погрешности измерений или ссылку на документ, в котором они приводятся.

В.4.1 Первый пункт раздела излагают в редакции: “Пределы допускаемой относительной погрешности измерений по данной методике ±1,5%” или “Погрешность измерений должна соответствовать требованиям, указанным в …” (ссылка на нормативный документ).

При указании приписанных характеристик погрешности измерений вместо “Пределы допускаемой погрешности …” излагают “Пределы погрешности …”, вместо “Погрешность измерений должна соответствовать требованиям, указанным в …” излагают “Погрешность измерений соответствует характеристикам, приведенным в …”.

Если предполагается существенная случайная составляющая погрешности измерений, то вместо “пределов” указываются “границы”, которые сопровождаются значением вероятности (например, Р=0,95).

Требования к погрешности измерений и приписанные характеристики погрешности измерений могут также быть выражены другими способами, указанными в [1].

В.4.2 Требования к погрешности измерений (приписанные характеристики) одной и той же величины могут быть различными для разных значений этой величины, разной продукции, разных условий измерений и использования результатов измерений. В этом случае, а также для нескольких измеряемых величин требования к погрешности измерений (приписанные характеристики) приводят в форме таблиц, графиков или уравнений.

В.5 Раздел “Средства измерений, вспомогательные устройства, материалы, растворы” содержит перечень средств измерений и других технических средств, применяемых при выполнении измерений.

В перечне этих средств наряду с наименованием указывают обозначения государственных стандартов (стандартов других категорий) или технических условий, обозначения типов (моделей) средств измерений, их метрологические характеристики (класс точности, пределы допускаемых погрешностей, пределы измерений и др.). При большом объеме метрологических характеристик они могут приводиться в приложении.

В.5.1 В приложении могут приводиться чертежи, технические характеристики и описания средств измерений и других технических средств разового изготовления.

В.5.2 Первый пункт раздела излагают следующим образом: “При выполнении измерений применяют следующие средства измерений и другие технические средства: (далее – перечень)” или “При выполнении измерений применяют средства измерений и другие технические средства, приведенные в таблице 1.

Таблица 1

Порядковый номер
и наименование средства измерений, технического средства

Обозначение стандарта, ТУ и типа средства измерений либо его метрологические характеристики, или ссылка на чертеж или приложение

Наименование измеряемой величины

В.6 Раздел “Метод измерений” содержит описание приемов сравнения измеряемой величины с единицей в соответствии с принципом, положенным в основу метода.

Если для измерений одной величины применяют несколько методов или документ устанавливает МВИ двух и более величин, то описание каждого метода выделяют в отдельный подраздел.

В.6.1 Первый пункт раздела (подраздела) излагают следующим образом: “Измерения (далее – наименование измеряемой величины) выполняют методом (далее следует описание принципа метода)”.

В.7 Раздел “Требования безопасности, охраны окружающей среды” содержит требования, выполнение которых обеспечивает при выполнении измерений безопасность труда, нормы производственной санитарии и охрану окружающей среды.

В.7.1 При наличии нормативных документов, регламентирующих требования безопасности, производственной санитарии и охраны окружающей среды, в разделе приводят ссылку на эти документы.

В.7.2 Первый пункт раздела излагают следующим образом: “При выполнении измерений (далее – наименование измеряемой величины) соблюдают следующие требования: (далее перечисляют требования безопасности, производственной санитарии, охраны окружающей среды)”.

В.8 Раздел “Требования к квалификации операторов” содержит сведения об уровне квалификации (профессии, образовании, практическом опыте и др.) лиц, допускаемых к выполнению измерений. Этот раздел включают в документ на МВИ при использовании сложных неавтоматизированных методов измерений и процедур обработки их результатов.

В.8.1 Первый пункт раздела излагают следующим образом: “К выполнению измерений и (или) обработке их результатов допускают лиц (далее – сведения об уровне квалификации)”.

В.9 Раздел “Условия измерений” содержит перечень влияющих величин, их номинальных значений и (или) границ диапазонов возможных значений, а также другие характеристики влияющих величин, требования к объекту измерений. К числу влияющих величин относят параметры сред (образцов), напряжение и частоту тока питания, внутренние импедансы объектов измерений и другие характеристики.

Допускается перечни влияющих величин приводить в виде таблицы.

В.9.1 Первый пункт раздела излагают следующим образом: “При выполнении измерений соблюдают следующие условия: (далее – перечень)” или “При выполнении измерений соблюдают условия, приведенные в таблице 2”.

Таблица 2

Наименование измеряемой величины

Наименование влияющей величины

Номинальное значение

Предельные отклонения

В.10 Раздел “Подготовка к выполнению измерений” содержит описания подготовительных работ, которые проводят перед выполнением непосредственно измерений. К этим работам относят предварительное определение значений влияющих величин, сборку схем (для этого в разделе или приложении приводят схемы), подготовку и проверку режимов работы средств измерений и других технических средств (установка нуля, выдержка во включенном состоянии, тестирование и т.п.), подготовку проб к измерениям.

В.10.1 Если при выполнении количественного химического анализа предусматривается установление градуировочной характеристики, то в разделе приводят способы ее установления и контроля, а также порядок применения образцов для градуировки, приготовления образцов при необходимости.

В.10.2 Если порядок подготовительных работ установлен в документах на средства измерений и другие технические средства, то в разделе приводят ссылки на эти документы.

В.10.3 Первый пункт раздела излагают следующим образом: “При подготовке к выполнению измерений проводят следующие работы: (далее – перечень и описания подготовительных работ)”.

В.11 Раздел “Выполнение измерений” содержит перечень, объем, последовательность операций, периодичность и число измерений, описания операций, требования к представлению промежуточных и конечных результатов (число значащих цифр и др.).

Для МКХА в разделе приводят также требования к массе и числу навесок пробы, а при необходимости указания о проведении “контрольного (холостого) опыта” и описание операций по устранению влияния мешающих компонентов пробы.

В.11.1 Если порядок выполнения операций установлен в документах на применяемые средства измерений и другие технические средства, то в разделе приводят ссылки на эти документы.

В.11.2 Если для измерений одной величины применяют несколько методов или документ устанавливает МВИ двух и более величин, то описание каждой операции выделяют в отдельный подраздел.

В.11.3 В разделе (подразделе) указывают требования о необходимости регистрации результатов промежуточных измерений и значений влияющих величин. При необходимости указывают формы регистрации промежуточных результатов измерений и значений влияющих величин.

В.11.4 Первый пункт раздела излагают следующим образом: “При выполнении измерений (далее – наименование измеряемой величины) выполняют следующие операции: (далее – описания операций)”.

В.12 Раздел “Обработка (вычисление) результатов измерений” содержит описания способов обработки и получения результатов измерений. Если способы обработки результатов измерений установлены в других документах, в разделе приводят ссылки на эти документы, например: “Обработка результатов измерений (далее – наименование измеряемой величины) – по ГОСТ 8.207”.

В.12.1 Если для измерений одной величины применяют несколько методов или документ устанавливает МВИ двух и более величин, то описание каждого способа обработки выделяют в отдельный подраздел.

В.12.2 В разделе при необходимости приводят данные, требуемые для получения результатов измерений (константы, таблицы, графики, уравнения и т.п.). При большом объеме данных их указывают в приложении.

В.12.3 В разделе указывают требования о необходимости регистрации обработки результатов промежуточных измерений и при необходимости указывают форму такой регистрации (на магнитной ленте, распечатке принтера и т.п.).

В.12.4 Первый пункт раздела излагают следующим образом: “Обработку результатов измерений (далее – наименование измеряемой величины) выполняют способом: (далее – описание способа)”.

В.13 Раздел “Контроль погрешности результатов измерений” содержит указания о нормативах, методах, средствах и плане (периодичности) проведения контроля погрешности результатов измерений, выполняемых по данной МВИ.

В.14 Раздел “Оформление результатов измерений” содержит требования к форме, в которой приводят полученные результаты измерений. В разделе указывают вид носителя полученной измерительной информации (документ, магнитная лента, лента самопишущего прибора и т.п.). При необходимости приводят сведения о применяемых средствах измерений и других технических средствах, дате и времени получения результата измерений.

В.14.1 Документ или запись удостоверяет лицо, проводившее измерения, а при необходимости – руководитель организации (предприятия), подпись которого заверяют печатью организации (предприятия).

В.14.2 Первый пункт раздела излагают следующим образом: “Результаты измерений оформляют протоколом, форма которого приведена в приложении (номер приложения)” или “Результаты измерений оформляют записью в журнале по указанной ниже форме (далее – таблица, график или другая форма представления результатов измерений)” или “Результаты измерений хранят (далее – указание о способах хранения на машинных носителях)”.

Применение стандартизованных методик – Измерения

В 07.07.2018 в 06:29, oly сказал:

Как применять МИ? 

Я особо утверждать не буду, т.к. не связан с химией, но прочтите этот же стандарт:

7.1. Национальные стандарты и другие документы в области стандартизации, включающие в себя правила и методы исследований (испытаний) и измерений, а также правила отбора проб образцов для применения технических регламентов, должны содержать только аттестованные методики измерений в соответствии с порядком разработки перечня национальных стандартов [19].

Т.е. если есть стандарт с методами измерений, то они (методы) аттестованы и применение стандарта с этими методами ни чему не противоречит.

Если кого-то что-то не устраивает, то пусть поступают, как написано в:

8.6. Претензии пользователей к аттестованным методикам измерений, возникшие в процессе их применения, должны быть направлены разработчикам методик с необходимыми обоснованиями.

Кроме того, если Вы аккредитованы, то должны работать в соответствии со своей ОА, а в ней соответственно, не может быть методик, которые еще не разработаны. Необходимо разработать, аттестовать, внедрить, внести в ОА…..

А стандарты для того и пишутся, чтобы по ним проводить испытания (измерения).

У нас, по крайней мере, вопросов не возникает по применению стандартизованных методик.

Кроме того, согласно ГОСТ ИСО/МЭК 17025-2009:

Примечание к п.5.4.1 “Международные, региональные, национальные стандарты или общепринятые технические условия, содержащие достаточную и краткую информацию о том, как проводить испытания и/или калибровку, не нуждаются в дополнениях или переоформлении в качестве внутренних процедур, если эти стандарты написаны так, что они могут быть использованы в опубликованном виде сотрудниками лаборатории”

п. 5.4.2. “…Преимущественно следует использовать методики, приведенные в международных, региональных (межгосударственных) или национальных стандартах…”.

 

Свидетельство об утверждении типа средств измерений (метрологический сертификат)

Любые средства измерения, импортируемые или производимые в России, основной задачей которых является определение величин с некоторой соответствующей высокой точностью, должны соответствовать требованиям.

Оформленное свидетельство об утверждении типа средств измерений (метрологический сертификат) является официальным подтверждением соответствия измерительного прибора установленным требованиям. Так называемая, процедура метрологической сертификации проводится на базе аккредитованных центров испытаний средств измерений. Именно в таких центрах после проведения тестирования принимается решение о выдаче или не выдаче свидетельства на соответствие оборудования.

Для запуска в работу

Для утверждения типа средств измерений и проведения испытаний необходимо:

  • Образцы средств измерений.
  • Техническая документация на оборудование.
  • Декларацие или ГОСТ Р, а также пакет разрешительных документов, который зависит от области применения средства измерения. Для медицинского оборудования, например, потребуется регистрационное удостоверение Минздравсоцразвития РФ, а также сертификат ТР ТС).
  • Фотография, отражающая общий вид средства измерения.

Для продления метрологического сертификата:

  • Оригинал выданного ранее свидетельства об утверждении типа средств измерений.
  • Подробное описание типа средств измерений, являющееся приложением к метрологическому сертификату.

Важно, что приборы обязаны входить в список измерительных средств, которые разрешены к применению на всей территории РФ.

Срок действия метрологического сертификата

При серийном производстве срок действия свидетельства об утверждении типа средства измерения ограничивается 5 годами. Продление действия сертификата при серийном производстве может быть проведено на 5 лет без дополнительных испытаний.

Для единичного средства измерения метрологический сертификат является бессрочным.

Как оформить свидетельство об утверждении типа средств измерений?

Для оформления сертификата компания производитель или импортер вместе с заявкой в группу компаний «Стандарт Групп» подает требуемый пакет документов, который будет определять основные параметры использования сертифицируемого измерительного прибора. В документах также описываются его технические характеристики и ключевые свойства.

Приняв ваши документы, мы сможем организовать корректное проведение испытаний предоставленных образцов измерительных средств. Данные тесты позволят определить тип средства измерения и установить порядок проведения дальнейших проверок в соответствии с типом. Протокол проведенных испытаний, являющийся основанием для выдачи метрологического сертификата, мы сопроводим в Росстандарт.

Максимальный срок принятия решения и выдачи готового сертификата согласно действующему законодательству составляет не более 40 дней.

Законодательство, устанавливающее порядок проведения оценки:

  • Федеральный закон Российской Федерации от 26 июня 2008 года № 102-ФЗ «Об обеспечении единства измерений».
  • Приказ Министерства промышленности и торговли Российской Федерации от 30.11.2009 г., № 1081.
  • Приказ Министерства промышленности и торговли Российской Федерации от 30.11.2009 г., № 1326.

Выгоды сотрудничества

  • Профессиональная консультационная помощь.
  • Гарантированные сроки оформления метрологического сертификата.
  • Оперативная подготовка и согласование документации.
  • Оказание помощи в составлении пакета документов.
  • Работа с одним менеджером, минуя ГЦИ СИ, ВНИИМС и Росстандарт.

Корпоративное видео группы компаний “Стандарт Групп”


Отправьте заявку, мы ответим в течении 15 минут!

Наша компания и лаборатория

Благодарственные письма от наших клиентов

Инкрементальные тесты 101: Intent-to-treat, PSA, Ghost Ads и Ghost Bids

В методологии «PSA/Placebo» контрольная группа получает настоящую рекламу. Идея состоит в том, чтобы предоставить контрольной группе социальную рекламу (PSA) — рекламу, которая помогает повысить общественную осведомленность, например баннеры с красным крестом или рекламу «Не пей за рулем».

Показывая реальную рекламу, мы получаем информацию о том, какие пользователи в контрольной группе были бы подвержены воздействию, что позволяет нам исключить из измерения не подвергавшихся воздействию пользователей.Это сводит шум к нулю.

В то время как реклама PSA проста в использовании на платформах самообслуживания и является отличным обходным путем для проблем с шумом, выявленных в результате тестирования Intent-to-treat — на самом деле тестирование повышения уровня PSA вообще не создает шума — этот метод является дорогостоящим и неустойчивым. . Маркетологам пришлось бы выделить часть своего бюджета на оплату показов контрольной группы, что, в свою очередь, уменьшило бы их прибыль. Поскольку тестирование и измерение инкрементальности наиболее эффективны, когда выполняются непрерывно (а не разовые тесты), выделение бюджета на рекламу социальной рекламы не является привлекательной долгосрочной стратегией.

Объявления социальной рекламы также могут быть неточными, если они реализованы неправильно. Например, при запуске двух разных кампаний в интеллектуальной системе доставки объявлений система, скорее всего, по-разному оптимизирует доставку двух кампаний, потому что объявления по своей сути разные:

  • «[Система] будет показывать объявления для типов пользователи, которые, скорее всего, нажмут. И пользователи, которые решат нажать на объявление о спортивных товарах или одежде, вероятно, будут сильно отличаться от тех, кто нажмет на объявление о благотворительности, что приводит к сравнению между «яблоками и апельсинами.«Следовательно, такое тестирование ПСА может привести к неверным результатам, от чрезмерно оптимистичных до ложноотрицательных». – Подумайте с помощью Google

Также можно предположить, что поведение контрольной группы полностью сопоставимо с поведением тестовой группы. Тестирование PSA игнорирует вероятность того, что один и тот же пользователь может сильнее отреагировать на рекламу «не пей за рулем», чем на рекламу типа «разблокировать-нового-персонажа-на-следующем-уровне». Определения групп в конечном итоге искажаются, что делает невозможным реальное сравнение.

Общий план порядкового последовательного испытания для испытания лечения в условиях возникающей пандемии

Аннотация

Фон

Проведение клинических испытаний для оценки экспериментальных методов лечения потенциально пандемических инфекционных заболеваний является сложной задачей. Поскольку многие вспышки инфекционных заболеваний длятся всего шесть-восемь недель, существует потребность в планах испытаний, которые можно было бы быстро внедрить в условиях неопределенности. Вспышки внезапны и непредсказуемы, поэтому очень важно заранее планировать как можно больше.Статистические аспекты таких дизайнов испытаний должны быть оценены и обсуждены на этапе готовности к внедрению.

Методология/Основные выводы

В этой статье предлагается общий план порядкового последовательного исследования (ГОСТ) для рандомизированного клинического исследования, сравнивающего экспериментальное лечение нового инфекционного заболевания со стандартным лечением. Дизайн задуман как готовый к использованию надежный и гибкий вариант. Первичной конечной точкой является категоризация результатов лечения пациентов по порядковой шкале.Применяется последовательный подход с остановкой, как только становится ясно, что экспериментальное лечение имеет преимущество или что достаточное преимущество вряд ли будет обнаружено. Свойства плана оцениваются с использованием теории больших выборок и проверяются для выборок среднего размера с помощью моделирования. Испытание предназначено для выявления общего клинически значимого различия, а именно отношения шансов, равного 2, для лучшего, а не для худшего исхода. Общий размер выборки (по обоим видам лечения) от 150 до 300 пациентов во многих случаях оказывается достаточным, но точное значение зависит как от величины преимущества лечения, так и от характера порядковой шкалы.Преимущество подхода состоит в том, что любые ошибочные предположения, сделанные на этапе планирования о доле пациентов, попадающих в каждую категорию результатов, мало влияют на вероятность ошибки исследования, хотя и могут привести к неточным прогнозам размера выборки.

Выводы/значение

Важно и целесообразно предопределить многие статистические аспекты эффективного дизайна исследования до вспышки заболевания. Затем дизайн можно адаптировать к конкретному изучаемому заболеванию, как только его природа будет лучше понята.

Резюме автора

Поскольку многие вспышки инфекционных заболеваний длятся всего шесть-восемь недель, существует потребность в планах испытаний, которые можно было бы быстро внедрить в условиях неопределенности. Общее порядковое последовательное исследование (ГОСТ) — это гибкий статистический дизайн для рандомизированного клинического исследования, сравнивающего экспериментальное лечение нового инфекционного заболевания со стандартной терапией. Детали конструкции получены для удовлетворения общих требований к мощности с использованием теории больших выборок.Затем точность подхода для умеренных размеров выборки проверяется с помощью миллионного моделирования, и оказывается, что он очень надежен в широком диапазоне обстоятельств. Общий размер выборки (по обоим видам лечения) от 150 до 300 пациентов оказывается достаточным во многих случаях, хотя может потребоваться большее количество пациентов, если большинство пациентов умирает или если у большинства наблюдается полное выздоровление, поскольку в этом случае имеется меньше доказательств, доступных для различать методы лечения. Преимущество подхода состоит в том, что любые ошибочные предположения, сделанные на этапе планирования о доле пациентов, попадающих в каждую категорию результатов, мало влияют на вероятность ошибки исследования, хотя и могут привести к неточным прогнозам размера выборки.

Образец цитирования: Уайтхед Дж., Хорби П. (2017) ГОСТ: Общий план порядкового последовательного испытания для испытания лечения в условиях возникающей пандемии. PLoS Negl Trop Dis 11(3): e0005439. https://doi.org/10.1371/journal.pntd.0005439

Редактор: Дэвид Джозеф Димерт, Школа медицины и медицинских наук Университета Джорджа Вашингтона, США

Поступила в редакцию: 4 октября 2016 г.; Принято: 27 февраля 2017 г .; Опубликовано: 9 марта 2017 г.

Copyright: © Whitehead, Horby, 2017.Это статья с открытым доступом, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Доступность данных: Все соответствующие данные содержатся в документе и в файлах вспомогательной информации.

Финансирование: Эта работа была поддержана фондом Wellcome Trust Великобритании (номер гранта 106491/Z/14/Z) и проектом ЕС FP7 PREPARE (602525).Спонсоры не участвовали в разработке исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

Конкурирующие интересы: Авторы заявили об отсутствии конкурирующих интересов.

Введение

Эпидемия болезни, вызванной вирусом Эбола, в 2013–2015 годах в Западной Африке высветила необходимость иметь возможность разрабатывать протоколы испытаний лечения в течение нескольких недель, а не месяцев или даже лет, на которые обычно уходят месяцы или даже годы. Клинические исследования эпидемических инфекционных заболеваний должны проводиться при появлении новых случаев.Срочность возникает потому, что вспышка может стихнуть до того, как можно будет извлечь какие-либо уроки о лечении, или, что еще хуже, вспышка может выйти из-под контроля до того, как будут разработаны эффективные методы лечения.

В этом документе представлены статистические аспекты дизайна испытаний, которые можно разработать заранее, а затем быстро адаптировать к конкретной вспышке. Общее порядковое последовательное исследование (ГОСТ) — это гибкий готовый статистический дизайн для рандомизированного клинического исследования, в котором экспериментальное лечение сравнивается со стандартным лечением возникающего инфекционного заболевания.Ключевые аспекты ГОСТ фиксируются заранее, так что клиницисты и статистики могут сразу принять эти общие черты и сосредоточиться на необязательных элементах, которые необходимо определить, а также на бесчисленных других задачах, связанных с инициированием клинического исследования такого рода. Предусмотренный контекст – это ситуация, когда на подготовку есть всего несколько недель, возможно, при ограниченных знаниях о естественном течении болезни. Этот документ также может быть полезной иллюстрацией для исследовательских групп, у которых больше времени на подготовку к испытанию.В этом случае специалисты по статистике испытаний могут захотеть изменить фиксированные элементы плана и изучить последствия, используя методы, описанные в [1], возможно, применяя статистический код, представленный в [2].

Полное название ГОСТ, Generic Ordinal Sequential Trial, включает в себя статистические термины порядковый и последовательный . Шкала порядкового номера представляет собой категоризацию результатов, для которых существует внутреннее ранжирование (или порядок) категорий с точки зрения желательности, но нет конкретного числового значения, придаваемого каждой из них.Клиническое исследование является последовательным , если оно проводится с использованием последовательности последовательных анализов, каждый из которых может решить основной клинический вопрос и привести к прекращению исследования. Первичная конечная точка исследования в ГОСТ представляет собой порядковую категоризацию результата пациента, зарегистрированного через определенное количество дней после рандомизации, и последовательный мониторинг приведет к остановке, как только станет ясно, что экспериментальное лечение имеет преимущество или что достаточное преимущество маловероятно. быть обнаруженным.Испытание предназначено для выявления общего клинически значимого различия, а именно отношения шансов, равного 2, для лучшего, а не для худшего исхода. Общий размер выборки (по обоим видам лечения) от 150 до 300 пациентов во многих случаях оказывается адекватным, точное значение зависит как от величины преимущества лечения, так и от характера порядковой шкалы.

Методы

Предварительно задано как можно больше характеристик ГОСТ, чтобы большая часть статистического раздела протокола исследования могла быть разработана заранее, до того, как станет известна природа заболевания и без подробностей экспериментального лечения.Другие элементы, такие как детали шкалы порядковых результатов, коэффициент рандомизации и день, когда будет проводиться первичная оценка пациента, должны быть быстро определены исследователями после возникновения вспышки.

Пациенты будут рандомизированы между экспериментальным лечением (E) и стандартным лечением (S), стратифицированными по лечебному центру и, возможно, по одному или двум другим ключевым прогностическим факторам. Обычно коэффициент распределения устанавливается равным 1:1 для простоты и потому, что при таком выборе ожидаемые размеры выборки сводятся к минимуму [3].Однако, если бы доступность E была ограничена, то коэффициент распределения можно было бы изменить, чтобы рандомизировать больше пациентов для S, чем для E.

Первичным ответом пациента будет статус пациента через D дней после рандомизации, отнесенного к одной из k групп результатов, C 1 , …, C k . D, вероятно, будет установлен на 7, 14 или 28 дней. Категории исходов должны быть однозначно определены, и каждый пациент должен попадать ровно в одну из них. Они также должны отражать менее желательные состояния по мере продвижения от C 1 (наилучший результат) к C k (наихудший результат).Результат C 1 может отражать полное выздоровление и C k смерть до дня D. Промежуточные результаты могут включать C 2 : жив и нуждается только в базовой поддержке и C 3 : жив, но нуждается в интенсивной поддержке, где эти термины нуждаются в тщательном определении для конкретных заболеваний. Нет необходимости, чтобы число пациентов в каждой категории результатов было большим, и метод остается действительным и точным, если одна или несколько категорий оказываются совершенно пустыми, при условии, что по крайней мере две категории хорошо представлены.Частный случай k = 2 допускает бинарный результат, такой как живой или мертвый.

Использование ответа, который доступен после короткой и фиксированной продолжительности наблюдения, снижает риск потери для последующего наблюдения и имеет важное значение, если исследование должно дать раннее заключение. ГОСТ представлен для случая порядкового ответа, поскольку ожидаемые размеры выборки будут уменьшены, если можно будет надежно идентифицировать более двух категорий результатов [3]. Кроме того, в начале исследования новой инфекции может быть неясно, будет ли ключевым вопросом предотвращение смерти или снижение заболеваемости.Использование категоризации, которая различает ряд состояний исхода, позволит испытанию быть информативным, если жизнь или смерть окажется основной проблемой или если летальные исходы окажутся редкими, и ключевой проблемой станет необходимость интенсивной терапии. В нормальных условиях для определения бинарной конечной точки исследования можно использовать пилотное исследование пациентов, получавших традиционное лечение: здесь мы заинтересованы в том, чтобы начать окончательное рандомизированное исследование как можно раньше во время вспышки.

Вероятность того, что пациент, получающий E, достигнет любой из категорий результата C 1 ,…, C j , обозначается P Ej .Достижение результата в любой из категорий C 1 ,…, C j предпочтительнее попадания в одну из категорий C j+1 ,…, C k , событие, которое происходит с вероятностью 1 – Р Эдж . Вероятность первого события равна O Ej = P Ej /(1 – P Ej ), а P Sj и O Sj определяются аналогично для пациентов, получающих S. Отношение шансов R j определяется как R j = O Ej / O Sj .Обратите внимание, что эти определения имеют смысл для значений j от 1 до k–1, но они не используются для j = k, поскольку P Ek и P Sk относятся к вероятности того, что пациент находится в любой из категорий результатов. , который должен быть равен 1, а соответствующие значения шансов не определены. Нулевая гипотеза состоит в том, что E не оказывает влияния, и в этом случае P Ej = P Sj и, следовательно, R j = 1 для каждого значения j от 1 до k–1. Если эта нулевая гипотеза верна, то вероятность вывода о том, что Е лучше, чем S (событие, которое далее будет обозначаться как «победа Е») устанавливается равной 0.025. Это односторонний риск ошибки I рода (обозначается α), и значение 0,025 выбрано по ГОСТ, чтобы следовать условности.

Наряду с рассмотрением свойств дизайна, когда лечение не дает эффекта (нулевая гипотеза), мы рассматриваем его свойства, когда имеется тенденция достижения пациентами лучших категорий исходов по E, чем по S, по всей шкале исходов ( Альтернативная гипотеза). Таким образом, лечение Е может привести к большему шансу на полное выздоровление, большему шансу на полное или частичное выздоровление и меньшему шансу на смерть.В частности, рассматриваются ситуации, в которых все отношения шансов от R 1 до R k−1 имеют одинаковую величину (обозначаемую общим значением R) и больше 1. Схема разработана таким образом, чтобы гарантировать, что, если R = 2, то вероятность того, что E выиграет, равна 0,90. В этом сила испытания. Альтернативная гипотеза представляет собой компромисс между желанием обнаружить небольшие, но значимые эффекты лечения и быстро завершить испытание. Для бинарного исхода отношение шансов, равное 2, соответствует увеличению вероятности успеха с ⅓ для S до ½ для E, или с 1/2 до ⅔, или с ⅔ до ⅘.Типичные размеры выборки при использовании ГОСТ находятся в диапазоне 150–300 (в сумме по обеим экспериментальным группам). Значение 0,90 выбрано из-за мощности ГОСТа, поскольку это общепринятый выбор: выбор 0,80 допускает слишком большой риск пропуска лечебного эффекта, равного R = 2. Для увеличения вероятности успеха с ½ на S до ⅗ по Е (R = 1,5) ГОСТ сделает вывод, что Е лучше, чем S с вероятностью 0,47. Размер выборки увеличился бы втрое до 450–900, если бы для альтернативы R = 1 была указана мощность 0,90.5.

Исследование будет отслеживаться с использованием серии до 20 промежуточных анализов, равномерно распределенных по вновь полученным ответам пациентов. В разделе результатов будет видно, что такой выбор приведет к необходимости примерно от 20 до 30 новых ответов (в сумме по S и E) между последовательными промежуточными анализами. Также будет видно, что обычно требуется только от 8 до 12 таких анализов, прежде чем испытание будет остановлено. Требования к данным для каждого пациента в каждом промежуточном анализе скромны: идентификационный номер пациента, дата рандомизации, лечение, лечебный центр и любые другие исходные факторы стратификации, а также статус в день D.Установка 20 промежуточных анализов для ГОСТ является субъективным выбором авторов, обеспечивающих гораздо более быструю реакцию на сообщение данных, чем установка только 3 или 4 промежуточных анализов, и в то же время более практичная, чем обновление последовательного графика каждый раз, когда получен отчет дня D.

При каждом промежуточном анализе рассчитываются две тестовые статистики. Первый представляет собой кумулятивную меру наблюдаемого преимущества E над S и обозначается Z. Второй количественно определяет количество информации о различиях в обращении, содержащихся в Z, и обозначается V.Выражения для расчета Z и V с учетом коэффициентов стратификации взяты из [4] и представлены в уравнениях (E1) и (E2) вспомогательной информации (S1 Text. Дополнительные технические детали). Мониторинг ГОСТ можно изобразить в виде графика значений Z, рассчитанных при каждом промежуточном анализе, в сравнении с соответствующими значениями V, используя диаграмму, показанную на рис. 1. Готовый график представлен в разделе результатов. Правило остановки представлено двумя прямыми линиями. Если Z лежит выше верхней линии, испытание останавливается и выигрывает E.Если нанесенное на график значение Z лежит ниже нижней линии, испытание прекращают и делают вывод, что доказательств того, что E лучше, чем S, не обнаружено. Этот дизайн является частным случаем треугольного теста [1, 2] и был предложен в качестве части фазы III стратегии исследования болезни, вызванной вирусом Эбола [5, 6].

На рис. 2 показана вероятность того, что E выиграет, в зависимости от натурального логарифма θ истинного отношения шансов R. При R = 1 (θ = 0) построенная вероятность составляет 0,025, а при R = 2 (θ = 0.693) это 0,90. На рис. 3 показана вероятность остановки во время или до выбранных промежуточных анализов в зависимости от истинного значения логарифмического отношения шансов θ. На обеих этих фигурах значения θ, соответствующие выбранным значениям отношения шансов R, также указаны на горизонтальной оси. Хотя допускается максимум 20 анализов, очень маловероятно, что потребуется больше 16. Если лечение либо вредно (R < 1, θ < 0), либо очень эффективно (R > 2,7, θ > 1), маловероятно, что потребуется более 4 промежуточных анализов (одна пятая от максимального размера выборки). .На рис. 4 показано ожидаемое значение V в конце испытания (то есть среднее значение конечного значения V по многим итерациям одного и того же испытания) в зависимости от θ. Как будет показано ниже, значения V на рис. 4 можно преобразовать в ожидаемые окончательные размеры выборки. Во время испытания V будет рассчитываться в соответствии с уравнением E2 в тексте S1, но до начала испытания взаимосвязь между размером выборки и V можно аппроксимировать с помощью уравнения E3 в тексте S1, чтобы получить график ожидаемого конечного размера выборки в зависимости от θ. , как будет показано в разделе результатов ниже.

Первичный анализ будет основан на используемом последовательном плане и будет включать одностороннее значение p для нулевой гипотезы об отсутствии различий в лечении, медианную несмещенную оценку и 95% доверительный интервал для R. В окончательном наборе данных количество новых пациентов, набранных в каждую лечебную группу, может не совпадать с запланированным в протоколе, коэффициент распределения может быть не таким, как предполагалось, и полученная информация V может быть не такой, как ожидалось. При условии, что отклонения от плана являются чисто случайными отклонениями, а не вызваны появляющимися данными, в анализе будут использоваться фактические значения этих величин.Таким образом, допустимо, если неожиданный всплеск пополнения приводит к тому, что для промежуточного анализа доступно больше информации, чем ожидалось, но для исследователей неприемлемо видеть значение Z близко к границе остановки и продвигать следующий промежуточный анализ. в надежде на быстрое заключение. Валидный анализ описан в [1], а статистический код для его реализации приведен в [2]. Для проведения окончательного анализа потребуется экспертный статистический вклад. В отличие от окончательной доработки дизайна, у специалиста по статистике должно быть достаточно времени для изучения и применения этих методов до того, как исследование подведет итоги.Хотя для окончательного анализа потребуется технический вклад, итог судебного разбирательства — независимо от того, выиграет ли Е или нет — будет сразу очевиден, если взглянуть на сюжет Z против V.

Когда исследование остановлено, могут оставаться пациенты, находящиеся на лечении, результат которых неизвестен, а также пациенты, статус которых стал известен в ходе проведения промежуточного анализа и его обсуждения. Данные от этих пациентов будут добавлены в окончательный «выходной» анализ [7] при условии, что они следовали протоколу без каких-либо изменений в лечении в связи с остановкой исследования.Последнее может быть не так, если экспериментальное лечение подозревается во вредности и, следовательно, оно прекращается у нынешних пациентов.

Результаты

Рассмотрите возможность сравнения экспериментального лечения (E) со стандартной терапией (S) при коронавирусе ближневосточного респираторного синдрома (БВРС-КоВ), вызванном внезапным увеличением числа и географического распространения новых случаев. Рандомизация 1:1. Мы выбираем D = 28 дней и категории результатов C 1 : жив и не получает ИВЛ; C 2 : жив и получает только неинвазивную вентиляцию легких; C 3 : жив и получает инвазивную искусственную вентиляцию легких и C 4 : мертв.Данные обсервационного исследования [8] 70 пациентов дают оценки вероятностей этих четырех исходов для пациентов на S, равные 0,286, 0,043, 0,214 и 0,457 соответственно.

В таблице 1 эти четыре вероятности результата образуют столбец 2. В первом из 12 наборов симуляций был проведен один миллион повторных прогонов ГОСТ, в которых эти вероятности исхода определяли ответы как для пациентов, получавших S, так и для тех, кто получал E. результаты представлены во втором столбце таблицы 2.Доля испытаний, в которых победил Е, составила 0,025; равна предполагаемой частоте односторонних ошибок I типа, что подтверждает точность процедуры. Во втором наборе симуляций вероятности исхода для пациентов, получающих S, не изменились, но было введено обычное отношение шансов R = 1,5 и соответствующие вероятности 0,375, 0,048, 0,217 и 0,359 (показаны в столбце 3 таблицы 1 и отражают сдвиг к лучшим исходам) использовались для получения исходов для пациентов на E. Для третьего набора симуляций распределение исходов на S снова не изменилось, но R было увеличено до 2.Результаты показаны в столбце 4 таблицы 2, показывая, что предполагаемая мощность 0,90 была достигнута.

Проведено еще девять симуляций. Распределения исходов для пациентов на S были изменены на те, что показаны жирным шрифтом в таблице 1 для сценария 2, а затем, как показано для сценариев 3 и 4. Для каждого сценария исследовались три распределения исходов на E, соответствующие R = 1 (нет эффект лечения), 1.5 и 2. В сценарии 2 используется округленная версия предполагаемого распределения по S, чтобы продемонстрировать, что точные значения не нужны на этапе проектирования.Сценарий 3 представляет собой более экстремальную ситуацию, в которой все пациенты либо покидают реанимацию, либо умирают к 28-му дню, в то время как в сценарии 4 большинство пациентов покидают реанимацию к 28-му дню, а остальные три категории являются необычными. Значения, представленные в таблице 2 для сценариев 1 и 2, практически неразличимы, но в случае сценариев 3 или 4 требуется больше пациентов.

При интерпретации результатов моделирования, показанных в Таблице 2, важно различать то, что разработчик испытания предполагал правдой до начала испытания, и то, что было на самом деле.Все симуляции представляют собой испытания, в которых исследователи предполагали, что сценарий 1 верен, даже если они ошибались. Как поясняется в дополнительной информации (текст S1), если сценарий 1 верен, то максимального размера выборки в 440 будет достаточно, чтобы гарантировать, что V в конечном итоге достигнет значения, при котором встречаются границы остановки на рис. 1, поэтому вывод должен быть достиг. Таким образом, для каждого из 20 промежуточных анализов потребуется 22 новых ответа пациента. Ожидаемые окончательные значения информационной статистики V, показанные на рис. 4, могут быть преобразованы в ожидаемые окончательные размеры выборки по Сценарию 1, и последние показаны красной кривой на рис. 5.Ожидаемый размер выборки значительно ниже максимального размера выборки, равного 440, независимо от истинного эффекта лечения. Предварительные прогнозы исследователей по смоделированным величинам показаны в последних трех столбцах таблицы 2.

Рис. 5. Ожидаемое значение окончательного размера выборки, построенное по сравнению с истинным значением логарифмического отношения шансов R, когда R 1 = R 2 = R 3 = R, когда необходимо собрать порядковые ответы и когда бинарные ответы должны быть собраны.

https://дои.org/10.1371/journal.pntd.0005439.g005

После настройки конструкции и прогнозирования ее свойств в предположении Сценария 1 затем проводится моделирование с использованием двенадцати различных моделей, представленных в Таблице 1. Для Сценария 1 при R = 1, 1,5 или 2, прогнозы исследователей подтверждаются как очень точные: средние размеры выборки не более чем в 3 раза превышают прогноз. Переход к Сценарию 2 показывает, как незначительные недостатки ожидаемой модели оказывают незначительное влияние. Сценарии 3 и 4 сильно отличаются от исходных предположений, и все же смоделированные вероятности того, что E выиграет, и смоделированные средние окончательные значения V остаются близкими к прогнозам.Однако средние размеры выборки, необходимые для того, чтобы прийти к заключению, значительно больше, чем предполагалось. Ошибка в отношении базовой модели на этапе разработки мало повлияет на вероятность ошибки исследования, но может привести к неточным прогнозам размера выборки. Дизайн реагирует на истинный характер собираемых данных, чтобы гарантировать, что будет собрана выборка соответствующего размера. Обратите внимание, что ни прогнозы, ни моделирование среднего размера выборки не включают пациентов, получающих лечение на момент анализа, но еще не давших ответа на 28-й день, а также пациентов, набранных во время проведения того, что оказывается окончательным промежуточным. анализ.

В таблице 3 представлены данные одного смоделированного запуска ГОСТ, а на рис. 6 показан результирующий график. Это фиктивное испытание остановилось на промежуточном анализе 11 th с 242 пациентами, и E выиграл. Используя подход, описанный в [1], одностороннее значение р равно 0,016. Медианная несмещенная оценка логарифмического отношения шансов θ составляет 0,568 с доверительным интервалом 95% (0,059, 1,062). Для отношения шансов R средняя несмещенная оценка составляет 1,76 с доверительным интервалом 95% (1,06, 2,89).Моделирование не генерировало данных пациентов, которые должны были быть получены исследователями после этого анализа, но на практике результаты поступали от пациентов исследования, которые все еще находились под наблюдением до 28 дней на момент, когда были получены данные для промежуточного анализа 11 th . извлеченных, и тех, кто был завербован во время проведения этого анализа. При условии, что лечение этих пациентов не было изменено, их можно было бы включить в последующий дополнительный анализ [7], и это стало бы окончательной интерпретацией результатов исследования.

Мы завершаем этот раздел кратким описанием изменений, которые последуют, если исследователи решат разделить реакцию пациентов на живых через 28 дней (C 1 , C 2 или C 3 ) или мертвых (C 4 ). Взятие округленных вероятностей исхода Сценария 2 и последующее объединение вероятностей, относящихся к первым трем категориям, приводит к Сценарию 3. К таким бинарным данным можно применять ГОСТ, а уравнения E4 в тексте S1 предоставляют упрощенные версии тестовой статистики.Однако бинарные данные менее информативны, чем порядковая версия данных, и теперь потребуется 520 ответов пациентов, чтобы гарантировать, что V в конечном итоге достигнет значения, при котором встречаются границы остановки на рис. 1. Таким образом, при каждом промежуточном анализе потребуется 26 новых ответов. Синяя кривая на рис. 5 показывает ожидаемые окончательные размеры выборки для бинарного подхода, и ее можно сравнить с красной кривой, соответствующей как сценарию 1, так и сценарию 2, поскольку они неразличимы. Увеличение размера выборки из-за дихотомии порядковой шкалы составляет 1.18: увеличение размера выборки на 18%. Дополнительное моделирование, проведенное с использованием 26 новых бинарных ответов на промежуточный анализ, подтвердило, что предполагаемая частота ошибок типа I 0,025 и мощность 0,90 были достигнуты, но увеличение средних конечных размеров выборки по сравнению с порядковым подходом, о котором сообщалось для сценариев 1 и 2 в Таблица 2 варьировалась от 17% до 26%.

Обсуждение

ГОСТ разработан для испытателей, которые торопятся из-за скорости распространения пандемии.Предполагается, что они используют дизайн ГОСТ, как описано в этом документе. Исследователи должны определить категории результатов и день D их наблюдения. Они также выбирают коэффициент распределения и любые факторы стратификации. Остальное как представлено выше.

Обычно для регистрации препарата требуются данные двух или более испытаний, хотя в определенных обстоятельствах достаточно доказательств только одного исследования [9, 10]. Было бы важно заранее определить, будет ли достаточно одного испытания при будущих вспышках инфекционных заболеваний.ГОСТ предлагает подход, который можно использовать один раз или повторить в повторном испытании, если это будет сочтено необходимым.

Для испытаний серии экспериментальных методов лечения болезни, вызванной вирусом Эбола, был предложен «платформенный подход» [11]. Сначала проводят сравнение обработки E 1 с S. Если обработка E 1 выиграет, она станет новым стандартом. Затем обработка E 2 сравнивается с текущим стандартом и так далее. Уровень α, необходимый для объявления лечения превосходящим контроль, фиксируется на уровне, относящемся к одному испытанию, без учета множественности экспериментальных воздействий.ГОСТ можно использовать в качестве схемы для каждого сравнения, проводимого в рамках платформенного подхода, при этом значение α должно быть установлено равным 0,025. Также возможны реализации ГОСТ, которые допускают одновременную рандомизацию между несколькими экспериментальными методами лечения и S.

Треугольный тест — это лишь один из многих последовательных методов, которые можно использовать в качестве основы для внедрения ГОСТ. Альтернативы, основанные на α = 0,025 и мощности 0,90, чтобы обнаружить отношение шансов, равное 2, были бы естественными конкурентами. Треугольный тест выбран потому, что среди тестов, удовлетворяющих приведенным выше требованиям к мощности, он минимизирует максимальный ожидаемый размер выборки, что происходит, когда R близко к 1.5 [12]. Эффективность треугольного теста достигается за счет его асимметрии. Для победы E требуются веские доказательства, но если превосходство не очевидно, испытание быстро прекратится без рекомендации E. Дизайн не пытается провести различие между отсутствием эффекта и вредом: в любом случае интерес к E больше не вызывает интереса, а ресурсы сокращаются. лучше посвятить другим экспериментальным методам лечения. Треугольный тест был разработан более 50 лет назад [13] и широко использовался в самых разных исследованиях [14].

Принятие проекта ГОСТ должно быть одобрено Советом по мониторингу данных и безопасности (DSMB), который рассматривает неслепые данные в ходе продолжающихся испытаний. Они обязаны рекомендовать прекратить исследование, если считают его небезопасным продолжать, учитывая первичную категоризацию статуса после D дней, а также данные о других конечных точках и от пациентов, которые еще не наблюдались в течение D дней. Их также попросят подтвердить любую рекомендацию по прекращению лечения, вытекающую из треугольных границ, принимая во внимание информацию об улучшении состояния пациента, не отраженную в первичном порядковом ответе, соответствующую внешнюю информацию и признаки серьезных расхождений в эффекте лечения в подгруппах пациентов.

За испытанием также будет наблюдать Руководящий комитет без доступа к данным открытого испытания. Однако этому комитету могут быть предоставлены данные о размере выборки и объеме информации V, доступной при каждом промежуточном анализе. Это обеспечило бы переоценку взаимосвязи между этими двумя величинами, как показано в уравнении E3 текста S1, которая не зависит от предварительных предположений. Чтобы защитить точность исследования, Руководящий комитет может разрешить изменение количества новых ответов пациентов, которые должны быть собраны для каждого промежуточного анализа, чтобы гарантировать, что приращения V будут ближе к их предполагаемым значениям.Поскольку это будет сделано без доступа к неслепым данным, систематическая ошибка не будет введена.

Треугольный тест сам по себе очень гибкий, и подход может быть переработан с другим выбором для α, мощности и R, а также с другими номерами и схемами промежуточных анализов (хотя название ГОСТ зарезервировано для конкретного случая, представленного здесь). Нормально распределенные данные, данные подсчета, данные о выживании и другие типы ответов также могут быть размещены [1].

Вклад авторов

  1. Концептуализация: JW PH.
  2. Формальный анализ: JW.
  3. Получение финансирования: PH.
  4. Методология: JW.
  5. Письмо – первоначальный вариант: JW PH.
  6. Написание – проверка и редактирование: JW PH.

Каталожные номера

  1. 1. Whitehead J. The Design and Analysis of Sequential Clinical Trials (пересмотренное второе издание). (1997), Чичестер: Wiley.
  2. 2. Уайтхед Дж.Еще раз о групповых последовательных испытаниях: простая реализация с использованием SAS. Статистические методы в медицинских исследованиях 2011 20: 636–656.
  3. 3. Уайтхед Дж. Расчеты размера выборки для упорядоченных категорийных данных. Медицинская статистика 1993 12: 2257–2271. пмид:8134732
  4. 4. Дарк Р., Болланд К., Уайтхед Дж. Статистические методы для упорядоченных категориальных данных на основе модели с ограниченными шансами. Биометрический журнал 2003 45: 453–470.
  5. 5. Купер Б.С., Бони М.Ф., Пан-нгум В., Дэй Н.П.Дж., Хорби П.В., Оллиаро П., Ланг Т., Уайт Н.Дж., Уайт Л.Дж., Уайтхед Дж. Оценка дизайна клинических испытаний для экспериментальных методов лечения болезни, вызванной вирусом Эбола. PLoS Med 2015 12: e1001815. пмид:25874579
  6. 6. Даннинг Дж., Кеннеди С.Б., Антиренс А., Уайтхед Дж., Цигленецки И., Карсон Г., Канапатипиллаи Р., Касл Л., Хауэлл-Джонс Р., Пардиназ-Солис Р., Гроув Дж., Скотт Дж., Ланг Т., Оллиаро П., Хорби П.В. Исследовательская группа RAPIDE-BCV.Экспериментальное лечение болезни, вызванной вирусом Эбола, бринцидофовиром. PLoS ONE 2016 11: e0162199 pmid:27611077
  7. 7. Уайтхед Дж. Превышение и отставание в последовательных клинических испытаниях. Контролируемые клинические испытания 1992 13: 106–121. пмид:1316826
  8. 8. Саад М., Омрани А.С., Байг К., Бахлул А., Эльзейн Ф., Матин М.А., Селим М.А.А., Аль Мутаири М., Аль Нахли Д., Аль Айдарус А.Ю., Аль Шербини Н., Аль-Хашан Х.И., Мемиш З.А., Альбаррак А.М. Клинические аспекты и исходы у 70 пациентов с коронавирусной инфекцией ближневосточного респираторного синдрома: опыт работы одного центра в Саудовской Аравии. Международный журнал инфекционных заболеваний 2014 29: 301–306. пмид:25303830
  9. 9. Даунинг Н.С., Аминавунг Дж.А., Шах Н.Д., Крумхольц Х.М., Росс Дж.С. Данные клинических испытаний, подтверждающие одобрение FDA новых терапевтических агентов, 2005–2012 гг. Журнал Американской медицинской ассоциации 2014 311:368–377. пмид:24449315
  10. 10. Коутан Д., Риггс Д., Ван Сант Хоффман Э. Существенные доказательства: когда одного испытания достаточно для одобрения и продвижения? Информационный журнал о наркотиках 2011 45: 253–263.
  11. 11. Прошан М.А., Додд Л.Е., Прайс Д. Статистические соображения для испытания терапии болезни, вызванной вирусом Эбола. Клинические испытания 2016 13:39–48. пмид:26768567
  12. 12. Лай ТЛ. Оптимальная остановка и последовательные тесты, минимизирующие максимально ожидаемый размер выборки. Статистические анналы 1973 1: 659–673.
  13. 13. Андерсон Т.В. Модификация последовательного теста отношения вероятностей для уменьшения размера выборки. Анналы математической статистики 1960 31: 165–197.
  14. 14. http://www.mps-research.com/PEST

4 метода измерения инкрементальности

Эксперты по инкрементальности

Еще в 2017 году наш директор по доходам в Северной и Южной Америке Алексей Чеменда выступил с докладом об измерении инкрементальности для повторного вовлечения. Это вызвало переход всей отрасли к измерению инкрементальности в качестве стандарта для оценки кампаний по повторному вовлечению в приложение. С тех пор методологии развились, и постепенность стала стандартом для оценки успеха кампании, но Адиктеев был первым, кто обсудил ее как основной показатель.

Со всей этой шумихой мы хотели бы вернуться к основам. Вот краткий обзор различных методологий, их плюсов и минусов. В нашей следующей статье мы рассмотрим тему, которую часто игнорируют: статистическую значимость тестов инкрементальности. Подпишитесь на нашу рассылку, чтобы не пропустить!

Что такое инкрементальный тест и почему он важен?

Как мы объясняли в предыдущем сообщении в блоге, тест инкрементальности, также называемый тестом повышения, дает представление о реальной ценности, добавленной маркетинговой стратегией или поставщиком.По сути, инкрементальный тест — это A/B-тест, сравнивающий влияние показа рекламы на тестовую группу и на контрольную группу, которая не видит никакой рекламы.

Давайте определим некоторые термины.

Тестовая группа — это группа пользователей, которым показывают рекламу повторного вовлечения. Эта группа используется для проверки инкрементальности.

Контрольная группа состоит из пользователей, которые не будут показывать рекламу повторного вовлечения.Эта группа используется в качестве базы для сравнения с тестовой группой и контроля результатов.

Защищенные пользователи — это пользователи, которые действительно видели рекламу.

Неэкспонированные пользователи — это пользователи, которые не видели рекламу.

Uplift — это увеличение (обычно в процентах) заданного KPI между двумя группами пользователей и часто используется как синоним возрастания.

Инкрементальные тесты позволяют рекламодателям сравнивать эффективность пользователей, которым не показываются объявления о повторном вовлечении, по сравнению с пользователями, которым показывают объявления.Измеряя рост стоимости покупок или повышение вовлеченности, которое обеспечивает реклама, рекламодатели могут использовать полученные сведения для лучшей оптимизации и прогнозирования расходов на рекламу , а также определить наиболее эффективную стратегию для достижения своих целей.

Как мы уже говорили, сегодня на рынке существует множество методологий, поэтому давайте рассмотрим, как они работают, а также плюсы и минусы каждой из них.

ITT (Intent To Treat): инкрементальная медицина

Ежедневный тест на инкрементальность избавляет от необходимости обращаться к врачу

на две группы:

А.тестовая группа , которая имеет право на просмотр рекламы повторного вовлечения, и

B. контрольная группа , , которая вообще не увидит никакой рекламы.

Намерение лечить

Хорошие новости:

Эта методология проста для понимания, относительно проста в применении и легко проверяется рекламодателем постфактум. Кроме того, поскольку контрольная группа не видит рекламы, это дешевле, чем некоторые другие методы увеличения, с которыми мы познакомимся позже.

Плохая новость:

Главная проблема ITT — шум. Незащищенные пользователи из тестовой группы отвлекают внимание, что сводит к минимуму влияние повторного вовлечения при сравнении тестовой группы со всей группой. 40-50% тестовой группы должны видеть рекламу, чтобы результаты были релевантными. Для показа рекламы такому большому проценту пользователей обычно требуется большой бюджет.

Метод PSA (Общественная реклама): Инкремент по стоимости

PSA: быть случайным дорого

Как это работает:

Метод социальной рекламы двух (открытых групп:) сравнивает

А.тестовая группа , которая видела рекламу повторного вовлечения, до

B. контрольная группа , которая видела несвязанную рекламу, в отличие от ITT. Обычно это объявления общественных служб (отсюда и название) таких организаций, как Красный Крест.

Общественная реклама

Хорошие новости:

Показывая реальную рекламу обеим группам, вы точно знаете, какие пользователи были раскрыты, а какие нет. Это главное преимущество социальной рекламы: вы можете сравнить пользователей, которые видели рекламу в обеих группах теста инкрементальности (либо в группе повторного вовлечения, либо в случайной).Здесь мы устраняем шум, создаваемый неэкспонированными пользователями в результатах.

Второе преимущество заключается в том, что это довольно легко реализовать. Вы можете создать одну и ту же инкрементальную кампанию для каждой группы, изменяя только отображаемые креативы.

Плохая новость:

Основным недостатком метода PSA является его стоимость. Эти случайные рекламные ролики стоят дорого и не приносят бренду никакого дохода. Если вы хотите снизить свои затраты на инкрементальность, это нарушает условия сделки.

Второй недостаток заключается в том, что тест на инкрементальность PSA игнорирует защитный эффект рекламы. При ИТТ это учитывается. Пользователи в тестовой группе видят вашу рекламу и не видят рекламу ваших конкурентов. С другой стороны, пользователи контрольной группы могут свободно видеть рекламу ваших конкурентов. Это позволяет получить более точное представление об эффективности креатива, поскольку вы можете предположить, что сравниваете эффективность собственной рекламы с эффективностью ваших конкурентов. С помощью PSA мы не можем измерить защитное воздействие.Контрольная группа видит случайную рекламу, возможно, вместо рекламы вашего конкурента. И вы, скорее всего, не конкурируете с Красным Крестом за пользователей.

Наконец, алгоритмы оптимизации ставок делают тесты инкрементальности PSA бесполезными. Эти алгоритмы выявляют пользователей в тестовой группе, которые с большей вероятностью совершат конверсию. Например, алгоритм может обнаружить, что один пользователь в тестовой группе с большей вероятностью совершит конверсию, чем другие пользователи, и этому пользователю будет показано больше объявлений, чем остальным членам группы.Эффект оптимизации не может быть воспроизведен в контрольной группе, которая видит случайную (PSA) рекламу.

Призрачная реклама: волшебный трюк увеличения

Остерегайтесь того, что вы не видите

Как это работает:

Метод фантомной рекламы создает ложную ставку, которая никогда не приводит к рекламе. Затем рекламодатель сравнивает тестовую группу с пользователями, которые увидели бы рекламу, если бы ставка сгенерировала реальную рекламу. Отсюда и название призрак.

Для этого имитируется аукцион в режиме торгов в реальном времени (RTB) для всех пользователей контрольной группы. Затем рекламодатель может сравнить поддельную или «фантомную» ставку с реальной выигравшей ставкой (той, которая привела к показу). Если цена призрачной ставки выше, чем цена выигрышного показа, пользователь увидит настоящую рекламу. Если цена призрачной ставки ниже, чем цена выигрышного показа, пользователь не увидит рекламу.

Объявления-призраки

Хорошие новости:

На бумаге эта методология является лучшей.Он сочетает в себе преимущества методов ITT и PSA. Нет шума от незащищенных пользователей, так как вы сравниваете незащищенных пользователей с потенциально незащищенными пользователями. И это без стоимости PSA, так как вы не платите за показ рекламы тестовой группе. Идеальный!

Плохая новость:

Основная проблема здесь заключается в способности рекламодателя проверить результаты. На самом деле рекламодателю почти невозможно проверить результаты этой методологии. Определение того, были ли эти призрачные ставки выше минимального уровня платформы предложения (SSP) и выше выигравшей заявки, не является точной наукой.Рекламодатели должны полностью полагаться на слово своего партнера для получения результатов.

Кроме того, SSP не всегда раскрывают минимальную сумму и цену выигрыша на аукционе, что делает невозможным выявление пользователей, которые могли увидеть рекламу. Если вы не Google или Facebook и не имеете доступа ко всему процессу аукциона, реализовать этот метод невозможно. И вы хотите доверять Facebook или Google, чтобы измерить влияние их собственного метода?

Вот краткий обзор типов тестов инкрементальности: Плюсы и минусы каждой методологии

Наше решение: ITT, улучшенное

Сокращение затрат и шума

Понятно, что каждая методология имеет свои недостатки, но мы мы нашли способ свести их к минимуму с помощью нашей собственной модифицированной версии ITT.

Основная цель методологии Адиктеева состоит в том, чтобы начать с наименьших затрат, чтобы выполнить ограничение теста инкрементальности и попытаться максимально уменьшить шум, чтобы получить значимые результаты. Мы разбили его на два шага.

Шаг 1: измерение приращения на уровне сегмента

Первым шагом для уменьшения шума является сравнение двух однородных групп (пользователей со схожими характеристиками). Для этого вам нужно определить определенный пользовательский сегмент (например, «активные покупатели») и разделить этот сегмент на тестовую и контрольную группу.

Следует избегать выполнения проверки инкрементальности на уровне приложения, поскольку у пользователей может быть слишком много разных профилей и характеристик.

Шаг 2: удалите неактивных пользователей RTB

Возможно, некоторые пользователи только что сменили свое устройство или потеряли его, или они просто не используют приложения, содержащие рекламу. Таким образом, они никогда не смогут увидеть рекламу, а будут генерировать шум только для теста.

Мы должны исключить этих пользователей как из тестовой, так и из контрольной группы, чтобы получить еще более значимые результаты.

Для этого мы должны удалить всех пользователей из обеих групп, которые не присутствовали в потоке заявок в период теста.

Наш метод измерения инкрементальности

Как MMP участвуют в измерении инкрементальности?

Теперь, когда мы установили методологию, давайте разберемся, как MMP участвуют в качестве стороны, ответственной за измерение. MMP играют ключевую роль в возможности создавать сегменты, которые мы хотели бы протестировать, и поддерживать их точность без дублирования.

Мы поговорили с нашими партнерами из Singular, одного из MMP следующего поколения на рынке, которые подчеркнули важность наличия надежной масштабируемой системы для создания точных наборов данных для инкрементального тестирования.

Понимание того, что сегменты, которые вы создаете, могут точно представлять пользователей, которые видят рекламу, как часть четко определенной тестовой группы, по сравнению с сегментом пользователей в той же кампании, которые не будут показывать рекламу, возможно, в любой другой носитель абсолютно важен для достоверности теста», — сказал Алон Нафта, вице-президент по продукту в Singular.«Кроме того, со временем вы должны убедиться, что вы точно измеряете ROAS для повторного вовлечения, поскольку вы не всегда будете участвовать в тестировании или можете в конечном итоге внести изменения по сравнению с первоначальным экспериментом, например, запустив с новый набор креативов.

Но как мы докажем, что тест инкрементальности сработал?

Теперь, когда мы знаем плюсы и минусы каждой методологии инкрементальности и определили улучшенный метод снижения шума, мы должны убедиться, что получили соответствующие результаты.

Мы считаем, что наиболее важным шагом является определение значимости теста, но многие игнорируют его в пользу больших, впечатляющих на вид цифр.

Возьмем в качестве примера результаты трехнедельного теста на инкрементальность:

Результаты трехнедельного теста на инкрементальность

Удивительные результаты? Не так быстро.

Судя по приведенной выше таблице, результаты нашего теста на прирост выглядят фантастически: +100% прирост дохода — это здорово!

Однако в данном конкретном случае рано делать выводы о влиянии кампании повторного вовлечения.Мы просто не можем сказать, потому что результаты не являются статистически значимыми без контекста. Важно определить, добились ли мы значимых результатов или нам просто повезло.

Как узнать, был ли ваш тест успешным или нет? Вы должны убедиться, что он не имеет предубеждений. Следите за нашей следующей статьей о статистической значимости и о том, как интерпретировать результаты теста инкрементальности.

Спасибо команде Singular за их вклад!

Анализ измерительных систем (MSA) — Учебное пособие «Шесть сигм»

Анализ измерительных систем (MSA) — это инструмент для анализа изменений, присутствующих в каждом типе инспекционного, измерительного и испытательного оборудования.Это система для оценки качества измерительной системы. Другими словами, это позволяет нам убедиться, что вариация нашего измерения минимальна по сравнению с вариацией нашего процесса.

Измерение является ключевым и важным элементом шести сигм. Анализ системы измерений (MSA) — это экспериментальный и математический метод определения того, насколько вариации в процессе измерения влияют на общую изменчивость процесса.

Что такое данные измерений и отклонения измерений?

Данные измерений представляют собой совокупность методов, инструментов или датчиков и операторов, используемых для получения измерений.

Помните, что DMAIC — это инструмент для устранения дефектов из нашего процесса, особенно путем ограничения вариаций. Более того, эта общая наблюдаемая вариация бывает двух видов:

Общая вариация = технологическая вариация + вариация измерения

Например, предположим, что вы измеряете, сколько чашек M&Ms находится в производственном цикле. Если вы измеряете с помощью мерного стакана, который не очень точен, а ваш коллега использует точный прибор, у вас будут разные измерения. Накопленная вариация между двумя вашими мерными чашками называется вариацией измерения.

Используйте последовательные измерения!

В качестве альтернативы представьте, что в колл-центре есть аудиторы, которые проверяют качество звонка каждого телефонного сотрудника. Если сотрудники по телефону оцениваются по этому качеству, это влияет на их зарплату. Таким образом, если бы каждый одитор выставлял оценки по разным стандартам, методика измерения была бы очень разнообразной, не так ли?

Как MSA влияет на этапы DMAIC

Зачем выполнять анализ измерительных систем

Основная цель анализа измерительной системы — оценить достоверность измерительной системы и попытаться свести к минимуму вариации процесса, вызванные измерением система.

  • Измеряет качество измерительной системы или прибора.
  • Организации обычно учитывают данные измерений при принятии решений, касающихся процесса или бизнеса. Поэтому данные должны быть точными.
  • Точность данных является одним из основных требований в процессе DMAIC. Это помогает оценить влияние системы измерения на собранные данные. Если данные системы измерения неточны, мы примем решение на основе неверных данных.
  • Мониторинг и измерение ресурсов является важным требованием в системах управления качеством, таких как ISO 9001, AS9100 и т. д.

Основы точной измерительной системы

Анализ измерительной системы направлен на то, чтобы квалифицировать измерительную систему для использования путем количественной оценки ее точности, прецизионности и стабильности.

1- Измерения считаются точными , если их тенденция сосредоточена вокруг фактического значения измеряемого объекта. Точность измерения достигается, когда измеренное значение имеет небольшое отклонение от фактического значения.

2- Измерения являются точными , если они отличаются друг от друга на небольшую величину.

Точность

Точность — это разница между истинным средним значением и наблюдаемым средним значением. Если среднее значение отличается от истинного среднего, то система не точна. Это признак неправильной системы.

  • Погрешность: Погрешность — это разница между наблюдаемым средним значением измерения и истинным или эталонным значением. Чтобы измерить смещение, сначала необходимо измерить одно и то же количество раз, а затем вычислить среднее значение измерения.

Простое смещение = Среднее значение измерения – Эталонное или истинное значение.

  • Линейность: Линейность — это разница в значении смещения в нормальном рабочем диапазоне измерительного прибора. Другими словами, это изменение смещения в рабочем диапазоне измерительного оборудования.
  • Стабильность:  Стабильность относится к способности измерительной системы давать одинаковые значения во времени при измерении одного и того же образца. Другими словами, это разница в среднем по крайней мере 2 наборов измерений с помощью прибора с течением времени.Система измерения стабильна только в том случае, если нет особой причины изменения, влияющей на погрешность системы измерения с течением времени.

Прецизионность

Прецизионность измерительной системы – это степень, в которой повторное измерение при неизменных условиях дает тот же результат. Другими словами, точность относится к близости двух или более измерений друг к другу.

  • Повторяемость:  Повторяемость — это отклонение между последовательными измерениями одной и той же детали с одной и той же характеристикой одним и тем же человеком с использованием одного и того же прибора.Другими словами, сколько различий мы видим в измерениях, сделанных одним и тем же человеком на одной и той же детали с использованием одного и того же инструмента?
  • Воспроизводимость:  Воспроизводимость — это разница в среднем измерении, сделанном разными людьми с использованием одного и того же прибора при измерении идентичной характеристики на одной и той же детали. Другими словами, насколько различаются результаты измерений, сделанных 90 075 разными 90 076 человеками на одной и той же части с использованием одного и того же инструмента?

См. также Повторяемость и воспроизводимость измерений

Калибровка

Калибровка – это процесс сравнения эталона или прибора с известной точностью с другим эталоном или прибором.Мы делаем это, чтобы обнаружить или сопоставить любое отклонение, таким образом, чтобы можно было выполнить корректировку, чтобы устранить ошибку измерения.

Интервал калибровки

Должен основываться на стабильности, назначении и степени использования.

Принципы калибровки

  1. Стабильность измерительного прибора
  2. Назначение измерительного прибора
  3. Как окружающая среда взаимодействует с измерительным прибором

решения на основе надежных данных, насколько это возможно.Анализ измерительной системы использует методы для понимания изменений в измерительном оборудовании.
Например, это изменение, внесенное в оборудование людьми и окружающей средой. Есть несколько полезных методов для оценки того, сколько ошибок из-за датчика, а также отдельных лиц.
Для MSA вы должны знать о нескольких типах ошибок и о том, как каждую из них можно допустить и избежать.

Погрешностью измерения считается разница между измеренным значением и истинным значением.Это зависит от двух вещей.

  • Какой прибор вы используете?
  • Кто использует прибор?

    Насколько допустима погрешность измерения?

    Согласно AIAG (2002), общее эмпирическое правило приемлемости измерительной системы:

    • Погрешность менее 10% является удовлетворительной.
    • Ошибка от 10 до 30 процентов предполагает, что система приемлема. Также это зависит от важности применения, стоимости измерительного прибора, стоимости ремонта и других факторов.
    • Считайте, что ошибка более 30% недопустима. Следовательно, вы должны улучшить систему измерения.

    Процедура анализа систем измерений (отсюда)

    • Определить тип сбора данных. Определите, являются ли данные непрерывными или дискретными.
    • Определить количество оценщиков, количество образцовых частей, а также количество повторных чтений.
    • Большее количество деталей и повторные измерения дают результаты с более высоким уровнем достоверности. Но также учитывайте время, стоимость и сбои.
    • Используйте оценщиков, которые обычно выполняют измерения и знакомы с оборудованием и процедурами.
    • В частности, убедитесь, что все оценщики соблюдают процедуры измерения.
    • Выберите части образца, чтобы представить весь разброс процесса.Это очень важный момент.
    • Если применимо, отметьте точное место измерения на каждой детали, чтобы свести к минимуму влияние отклонений внутри детали (например, некруглость).
    • Кроме того, убедитесь, что измерительное устройство имеет адекватную дискриминацию/разрешение, как указано в разделе «Требования».
    • Детали должны быть пронумерованы, а измерения должны производиться в случайном порядке, чтобы оценщики не знали номер, присвоенный каждой детали, или любое предыдущее значение измерения для этой детали.Кроме того, третья сторона должна записать измерения, оценщика, номер испытания и номер каждой детали в таблице.

    Также, см. Вопрос: При калибровке нашей системы измерения для обеспечения точности данных мы часто сталкиваемся с погрешностью, которая представляет собой __________________ измеренного значения от ________________ значения.(Взято из экзамена на зеленый пояс Iassc.)

    (A) Разброс, среднее значение совокупности
    (B) Отклонение, ожидаемое
    (C) Отклонение, истинное
    (D) Разброс, идея

    Ответ:

    Сертификация «Черный пояс шести сигм» Анализ системы измерения Вопросы:

    Вопрос: При анализе системы измерения какая из следующих пар показателей данных используется для определения общей дисперсии? (Взято из экзамена на черный пояс ASQ.)

    (A) Дисперсия и воспроизводимость процесса
    (B) Система шума и повторяемость
    (C) Дисперсия измерения и дисперсия процесса
    (D) Дисперсия и систематическая погрешность

    Ответ:

    Вопрос: Анализ измерительной системы предназначен для оценки статистических свойств:

    (A) вариации калибра
    (B) производительности процесса
    (C) стабильности процесса
    (D) технических допусков

    Ответ:

    .

Добавить комментарий

Ваш адрес email не будет опубликован.