Погрешности измерений, обработка результатов, выбор средств измерений — Мегаобучалка
Абсолютная погрешность выражается в . . .
+: единицах измеряемой величины
Амперметр с пределами измерений 0 … 10 А показывает 8А. Погрешность от подключения амперметра в цепь ∆S = – 0,2 А. Среднее квадратическое отклонение показаний прибора σI = 0,3 А. Укажите доверительные границы истинного значения измеряемой силы тока в цепи с вероятностью Р = 0,9544 (tP = 2)
+: I = (8,2 ± 0,6) А, Р = 0,9544
Вольтметр показывает 230В. Среднее квадратическое отклонение показаний . Погрешность от подключения вольтметра в цепь (изменение напряжения) равна -1В. Истинное значение напряжения с вероятностью равно …
+:
Доверительными границами результата измерения называют …
+: пределы значения случайной величины Х при заданной вероятности Р
Неконтролируемым источником погрешности измерения является…
+: возможное случайное отклонение измеряемой величины
Оценкой истинного значения по результатам многократных измерений является . . .
+: среднее арифметическое значение
Погрешность, выраженная формулой
∆ = А – Хист является . . .
+: абсолютной
Поправка на показание весов, систематическая погрешность которых составляет +1,0 г. равна
+: -1,0 г
Поправка на показание весов, систематическая погрешность которых составляет -1,0 г. равна
+: +1,0 г
По характеру изменения результатов измерений погрешности разделяют на…
+: систематические, случайные и грубые
При выборе средства измерений целесообразно обеспечить соотношение предела допускаемой и реальной погрешностей измерения
+:
При выборе средства измерения температуры производственного помещения предел допускаемой погрешности измерения следует принять
+:
При измерении падения напряжения вольтметр показывает 36В. Среднее квадратическое отклонение показаний σI = 0,5В. Погрешность от подключения вольтметра в сеть . Доверительные границы для истинного значения падения напряжения с вероятностью р = 0,95(tP = 2) можно записать
+:
При измерении размера были следующие источники погрешности измерений: средства измерений ∆СИ = ± 0,05 мм, отсчета оператора ∆ОП = ± 0,01 мм. Реальная погрешность измерения ∆ будет равна . . .
+: ± 0,06 мм
При измерении температуры в помещении термометр показывает 28 оС. Погрешность градуировки термометра + 0,5 оС. Среднее квадратическое отклонение показаний σ Т = 0,3 оС. Укажите доверительные границы для истинного значения температуры с вероятностью Р= 0,9973 (t P =3)
+: Т = (27,5 ±0,9) оС, Р= 0,9973
При измерении температуры Т в помещении термометр показывает 26 оС. Среднее квадратическое отклонение показаний σ Т = 0,3 оС. Систематическая погрешность измерений ∆S + 0,5 оС. Укажите доверительные границы для истинного значения температуры с вероятностью Р= 0,9973 (t P =3)
+: 24,6 оС ≤ Т ≤ 26,4 оС Р= 0,9973
При измерении усилия динамометр показывает Н, погрешность градуировки равна – 50Н. Среднее квадратическое отклонение показаний =10Н. Укажите доверительные границы для истинного значения измеряемого усилия с вероятностью
+:
При измерении электрического сопротивления нагрузки омметр показывает 85 Ом. Среднее квадратическое отклонение показаний . Погрешность от подключения омметра в сеть . Доверительные границы для истинного значения сопротивления с вероятностью ( ) можно записать
+:
При многократном измерении влажности воздуха получены значения 65, 64, 66, 65, 63, 64, 66, 67. Укажите доверительные границы для истинного значения влажности в % с вероятностью
+:
При многократном измерении диаметра отверстия индикаторным нутромером, настроенным на номинальный размер , получены отклонения в мкм: 0, +1, +3, +1, -1. При вероятности P=0.982 коэффициент Стьюдента . Результат измерения следует записать…
+:
При многократном измерении длины L получены значения в мм 30,2; 30,0; 30,4; 29,7; 30,3; 29,9; 30,2. Укажите доверительные границы истинного значения длины с вероятностью
+:
При многократном измерении силы F получены значения в Н: 263; 268; 273; 265; 267; 261; 266; 264; 267. Доверительный интервал для истинного значения силы с вероятностью Р=0,90 (tP = 1,86) равен . . .
+: F = 266 ± 2 Н, Р=0,90
При многократном измерении силы F получены значения в Н: 403; 408; 410; 405; 406; 398; 406; 404. Укажите доверительные границы истинного значения силы с вероятностью Р= 0,95 (tp = 2,365)
+: 402 Н ≤ F ≤ 408 Н, Р= 0,95
При многократном измерении температуры T в производственном помещении получены значения в градусах Цельсия 20,4; 20,2; 20,0; 20,5; 19,7; 20,3; 20,4; 20,1. Укажите доверительные границы истинного значения температуры в помещении с вероятностью
+:
При оценке реальной погрешности измерений не учитывается . . .
+: возможное случайное отклонение измеряемой величины от заданного значения
При оценке реальной погрешности измерения ∆ необходимо учитывать
+: инструментальную, методическую и субъективную составляющие погрешности измерения
Белорусский государственный университет транспорта – БелГУТ (БИИЖТ)
События
Все события
Пн | Вт | Ср | Чт | Пт | Сб | Вс |
---|---|---|---|---|---|---|
1 Дата : 2022-12-01 | 2 | 3 Дата : 2022-12-03 | 4 Дата : 2022-12-04 | |||
5 | 6 | 7 Дата : 2022-12-07 | 8 Дата : 2022-12-08 | 9 Дата : 2022-12-09 | 10 Дата : 2022-12-10 | 11 |
12 | 13 Дата : 2022-12-13 | 14 | 15 | 16 | 17 | 18 |
19 | Дата : 2022-12-20 | 21 Дата : 2022-12-21 | 22 Дата : 2022-12-22 | 23 | 24 | 25 |
26 Дата : 2022-12-26 | 27 | 28 | 29 | 30 | 31 |
Все анонсы
- Восьмая вузовская олимпиада «Звездочки не только н. ..
- Набор в сектор науки Студенческого совета…
- Программа. I международная научно-техническая конф…
- Мастер класс по художественному мастерству…
- Заседание совета университета…
- Олимпиада по начертательной геометрии …
- Выставка «Геноцид в Гомельской области во время В…
- ЕДИ «Основные направления государственной политики…
- Приглашение на каток
- Финал осенней серии игр «ЧТО? ГДЕ? КОГДА?» среди с…
Анонсы
Университет
Абитуриентам
Студентам
Конференции
Приглашения
Восьмая вузовская олимпиада «Звездочки не только н…
Набор в сектор науки Студенческого совета…
Программа. I международная научно-техническая конф…
Мастер класс по художественному мастерству…
Новости
Университет
Международные связи
Спорт
Воспитательная работа
Жизнь студентов
Новости подразделений
- Университет
Защиты магистерских диссертаций – ГЭК 2022.
20 декабря 2022
- Университет
Участие в XVI международном студенческом научном форуме «Студенческая …
20 декабря 2022
- Воспитательная работа
Семинар идеологического актива Гомельской области…
20 декабря 2022
- Воспитательная работа
Волонтерское движение набирает темп
20 декабря 2022
- Университет
Участие во II Всероссийской предметной олимпиаде по истории для студен…
19 декабря 2022
- Университет
Музей Управления КГБ по Гомельской области…
19 декабря 2022
- Университет
Победа БелГУТа на VII Всероссийской студенческой научно-практической к. ..
19 декабря 2022
- Воспитательная работа
Вместе не только учиться, но и отдыхать!…
16 декабря 2022
- Университет
Новый номер газеты «Вести БелГУТа»
16 декабря 2022
Другие новости
- Диалоговая площадка с Алексеем Талаем
- 75-летие Республиканского государственно-общественного объединения «Бе…
- Единый день информирования на ОАО «Мозырский домостроительный комбинат…
- Итоги конкурсов Института современного образования «SmartSkills»…
- Лица, имена, люди | Выпуск 2 | Старжинский Виктор Евгеньевич…
- День студенческого самоуправления электротехнического факультета…
- С юбилеем, уважаемый Федор Ефимович!
- Итоги олимпиады ТОСВ-2022
- Работы студентов БелГУТа на конкурсы к 160-летию Белорусской железной . ..
- Выпуск группы повышения квалификации по теме «Современные технологии у…
- К 160-летию белорусской магистрали
КУДА ПОСТУПАТЬ
Все факультеты
БелГУТ на Доске почета
Достижения университета
Предложения
Все предложения
Видеотека
Все видео
Фотогалерея
Все фото
Глава 4. Ошибка и предвзятость измерения
Другие главы в Эпидемиология для непосвященных
Эпидемиологические исследования измеряют характеристики населения. Интересующим параметром может быть уровень заболеваемости, распространенность воздействия или, что чаще, некоторая мера связи между воздействием и заболеванием. Поскольку исследования проводятся на людях и имеют все сопутствующие практические и этические ограничения, они почти всегда подвержены предвзятости.
Смещение выбора
Смещение выбора возникает, когда изучаемые субъекты не являются репрезентативными для целевой группы, в отношении которой должны быть сделаны выводы. Предположим, исследователь хочет оценить распространенность чрезмерного употребления алкоголя (более 21 единицы в неделю) среди взрослых жителей города. Он может попытаться сделать это, выбрав случайную выборку из всех взрослых, зарегистрированных у местных врачей общей практики, и отправив им по почте вопросник об их привычках к алкоголю. При таком дизайне одним из источников ошибки будет исключение из выборки жителей, не состоящих на учете у врача. Эти исключенные субъекты могут иметь разные модели употребления алкоголя по сравнению с включенными в исследование. Кроме того, не все испытуемые, отобранные для исследования, обязательно заполнят и вернут анкеты, а у тех, кто не ответил, могут быть иные привычки употребления алкоголя, чем у тех, кто потрудился ответить. Оба этих недостатка являются потенциальными источниками систематической ошибки отбора. При определении выборки для исследования всегда следует учитывать возможность систематической ошибки отбора. Кроме того, если ответы неполные, необходимо оценить масштаб предвзятости. Проблемы неполного ответа на опросы рассматриваются далее в 9.0005
Информационная погрешность
Другой основной класс систематической ошибки возникает из-за ошибок в измерении воздействия или заболевания. В исследовании по оценке относительного риска врожденных пороков развития, связанных с воздействием на мать органических растворителей, таких как уайт-спирит, матерей детей с пороками развития опрашивали об их контакте с такими веществами во время беременности, и их ответы сравнивали с ответами матерей контрольной группы с нормальным дети. При таком дизайне существовала опасность, что «случайные» матери, которые были очень заинтересованы в том, чтобы выяснить, почему их дети родились с отклонениями, могли вспомнить прошлое воздействие более полно, чем контрольная группа. Если это так, то результатом будет предвзятость с тенденцией к преувеличению оценок риска.
В другом исследовании изучался риск остеоартрита тазобедренного сустава в зависимости от физической активности на работе, случаи были выявлены на основании записей о поступлении в больницу для замены тазобедренного сустава. Здесь была возможность предвзятости, потому что испытуемые с физически тяжелой работой могли быть более инвалидами из-за данного уровня артрита и, следовательно, с большей готовностью обращались за лечением.
Систематическая ошибка обычно не может быть полностью исключена из эпидемиологических исследований. Таким образом, цель должна состоять в том, чтобы свести его к минимуму, выявить те предубеждения, которых нельзя избежать, оценить их потенциальное влияние и принять это во внимание при интерпретации результатов. Девизом эпидемиолога вполне могло быть «грязные руки, но чистый разум» (manus sordidae, mens pura).
Ошибка измерения
Как указывалось выше, ошибки в измерении воздействия или заболевания могут быть важным источником систематической ошибки в эпидемиологических исследованиях. Поэтому при проведении исследований важно оценивать качество измерений. Идеальный метод опроса является действительным (то есть он точно измеряет то, что должен измерять). Иногда имеется надежный стандарт, по которому можно оценить достоверность метода обследования. Например, достоверность сфигмоманометра можно измерить, сравнив его показания с внутриартериальным давлением, а достоверность маммографического диагноза рака молочной железы можно проверить (с согласия женщины) с помощью биопсии. Однако чаще всего нет надежного эталонного стандарта. Достоверность опросника для диагностики стенокардии не может быть полностью известна: клиническое мнение экспертов различается, и даже коронарные артериограммы могут быть нормальными в истинных случаях или аномальными у бессимптомных людей. Патолог может описать изменения при вскрытии, но они мало что могут сказать о симптомах или функциональном состоянии пациента. Измерения болезней в жизни часто не могут быть полностью подтверждены.
Таким образом, на практике действительность может оцениваться косвенно. Обычно используются два подхода. Технику, которая была упрощена и стандартизирована, чтобы сделать ее пригодной для использования в обследованиях, можно сравнить с наилучшей общепринятой клинической оценкой. Самостоятельно заполняемый психиатрический вопросник, например, можно сравнить с мнением большинства психиатрической комиссии. В качестве альтернативы измерение может быть подтверждено его способностью предсказывать будущее заболевание. Однако валидация по предсказательной способности может потребовать изучения многих предметов.
Анализ валидности
Когда метод опроса или тест используются для дихотомии субъектов (например, как случаи или не случаи, выявленные или не выявленные), его достоверность анализируется путем классификации субъектов как положительных или отрицательных, сначала методом опроса. а во-вторых, по стандартному эталонному тесту. Полученные результаты затем могут быть выражены в таблице непредвиденных обстоятельств, как показано ниже.
Таблица 4.1 Сравнение обзорного теста с эталонным тестом | |||
Survey test result | Reference test result | Totals | |
Positive | Negative | ||
Positive | True positives correctly identified = (a) | Ложноположительные результаты = (b) | Всего положительных результатов теста = (a + b) |
Отрицательные результаты | Ложноотрицательные результаты = (c) | Правильно идентифицированные истинно отрицательные результаты = (d) | Всего отрицательных результатов = (c + d) |
Итого | Всего истинно положительных результатов = (a + c) | Всего истинно отрицательных результатов = (b + d) | Общая сумма = (a + b + c + d) |
Из этой таблицы можно вывести четыре важных статистических показателя:
Чувствительность – чувствительный тест выявляет большую часть истинных случаев, и это качество измеряется здесь как a/a + c.
Специфичность. Специфический тест дает мало ложноположительных результатов, и это качество измеряется как d/b + d.
Систематическая ошибка. Для эпидемиологических показателей особенно важно, чтобы тест давал правильное общее количество случаев. Это измеряется отношением общего числа положительных результатов опроса и эталонных тестов, или (а + b)/(а + с).
Прогностическое значение — доля положительных результатов теста, которые действительно являются положительными. Это важно при скрининге и будет обсуждаться далее в главе 10.
Следует отметить, что как систематическая ошибка, так и прогностическая ценность зависят от относительной частоты истинно положительных и измеряемого заболевания или воздействия).
Чувствительный или специфический? Вопрос выбора
Если критерии положительного результата теста строгие, ложноположительных результатов будет немного, но тест будет нечувствительным. И наоборот, если критерии смягчены, ложноотрицательных результатов будет меньше, но тест будет менее специфичным. При обследовании рака молочной железы альтернативные диагностические критерии сравнивали с результатами эталонного теста (биопсии). Клиническая пальпация врачом дала наименьшее количество ложноположительных результатов (специфичность 93%), но пропустила половину случаев (чувствительность 50%). Критерии диагностики «случая» затем были смягчены, чтобы включить все положительные результаты, выявленные при пальпации врачом, медсестрой или рентгеновской маммографии: несколько случаев были пропущены (9).чувствительность 4%), но специфичность упала до 86%.
Путем выбора правильного теста и точек отсечки можно получить баланс чувствительности и специфичности, который лучше всего подходит для конкретного исследования. В опросе для установления распространенности это может быть, когда ложноположительные результаты уравновешивают ложноотрицательные. В исследовании по сравнению показателей в разных популяциях абсолютные показатели менее важны, основная задача состоит в том, чтобы избежать систематической погрешности в сравнениях: вполне может быть предпочтительнее конкретный тест, даже ценой некоторой потери чувствительности.
Повторяемость
Когда нет удовлетворительного стандарта, по которому можно было бы оценить достоверность метода измерения, часто бывает полезно изучить его воспроизводимость. Стабильные результаты не обязательно означают, что методика действительна: лабораторный тест может постоянно давать ложноположительные результаты, или очень повторяемый психиатрический опросник может быть нечувствительным показателем, например, «стресс». Однако плохая повторяемость указывает либо на плохую достоверность, либо на то, что измеряемая характеристика меняется со временем. В любом из этих обстоятельств результаты следует интерпретировать с осторожностью.
Повторяемость можно проверить среди наблюдателей (т. е. один и тот же наблюдатель выполняет измерение в двух разных случаях), а также между наблюдателями (сравнивая измерения, сделанные разными наблюдателями на одном и том же объекте или образце). Оценка повторяемости может быть встроена в исследование — выборка людей, проходящих повторное обследование, или выборка рентгенограмм, образцов крови и т. д., которые тестируются в двух повторностях. Даже небольшая выборка ценна при условии, что (1) она репрезентативна и (2) повторные тесты действительно независимы. Если тестирование проводится «в автономном режиме» (возможно, как часть пилотного исследования), то необходимо уделять особое внимание тому, чтобы испытуемые, наблюдатели и рабочие условия адекватно репрезентативны для основного исследования. Гораздо проще проверить воспроизводимость, когда материал можно транспортировать и хранить, например образцы глубокозамороженной плазмы, гистологические срезы, всевозможные записи и фотографии. Однако такие тесты могут исключить важный источник вариаций наблюдателей, а именно методы получения образцов и записей.
Причины различий в повторных измерениях
Независимые повторные измерения у одних и тех же субъектов обычно отличаются больше, чем можно было бы предположить. Чтобы интерпретировать результаты и искать средства, полезно разделить общую изменчивость на четыре компонента:
Вариация в пределах наблюдателя – Обнаружение собственного непостоянства может быть травмирующим; это подчеркивает отсутствие четких критериев измерения и интерпретации, особенно в отношении серой зоны между «нормальным» и «ненормальным». Оно во многом случайно, то есть непредсказуемо по направлению.
Изменчивость между наблюдателями. Включает первый компонент (нестабильность отдельных наблюдателей), но добавляет к нему дополнительный и систематический компонент из-за индивидуальных различий в методах и критериях. К сожалению, это может быть большим по сравнению с реальной разницей между группами, которую предполагается выявить. Этой проблемы можно избежать, либо используя одного наблюдателя, либо, если материал можно транспортировать, направив его весь на централизованное исследование. В качестве альтернативы систематическая ошибка в опросе может быть нейтрализована случайным распределением субъектов среди наблюдателей. Каждый наблюдатель должен быть идентифицирован кодовым номером в протоколе съемки; тогда анализ результатов наблюдателем укажет на любые серьезные проблемы и, возможно, позволит внести некоторую статистическую поправку на систематическую ошибку.
Случайное отклонение субъекта. При многократном измерении у одного и того же человека физиологические переменные, такие как артериальное давление, демонстрируют примерно нормальное распределение относительно среднего значения субъекта. Тем не менее опросы обычно ограничиваются одним измерением, и неточность не будет заметна, если не будет изучена степень предметной изменчивости. Случайное изменение субъекта имеет некоторые важные последствия для скрининга, а также в клинической практике, когда вызываются люди с экстремальными начальными значениями. Благодаря статистической причуде эта группа затем, кажется, улучшается, потому что в ее состав входят некоторые, чье среднее значение является нормальным, но которые случайно имели более высокие значения при первом обследовании: в среднем их последующие значения обязательно имеют тенденцию к падению (регрессия к среднему). Величина этого эффекта зависит от количества случайных вариаций субъекта. Неверной интерпретации можно избежать путем повторных обследований для установления адекватного базового уровня или (в интервенционном исследовании) путем включения контрольной группы.
Предвзятое (систематическое) изменение предмета. На артериальное давление большое влияние оказывает температура в комнате для осмотра, а также менее стандартизированные эмоциональные факторы. Обследования по выявлению диабета обнаруживают гораздо более высокую распространенность во второй половине дня, чем утром; а стандартный вопросник по бронхиту, возможно, дает больше положительных ответов зимой, чем летом. Таким образом, условия и время расследования могут иметь большое влияние на истинное состояние человека и на его или ее реакцию. Насколько это возможно, исследования должны быть спланированы так, чтобы контролировать это, например, путем тестирования на диабет в одно и то же время дня. В качестве альтернативы можно измерить и учесть в анализе такую переменную, как комнатная температура.
Анализ воспроизводимости
Повторяемость измерений непрерывных числовых переменных, таких как артериальное давление, можно обобщить с помощью стандартного отклонения повторных измерений или их коэффициента вариации (среднее стандартное отклонение). Когда были сделаны пары измерений либо одним и тем же наблюдателем в двух разных случаях, либо двумя разными наблюдателями, диаграмма рассеяния удобно покажет степень и характер вариации наблюдателя.
Для качественных признаков, таких как клинические симптомы и признаки, результаты сначала представляются в виде таблицы сопряженности:
Table 4.2 Comparison of results obtained by two observers | |||
Observer 1 | |||
Positive | Negative | ||
Observer 2 | Positive | a | b |
Отрицательный | c | d |
Общий уровень согласия может быть представлен пропорцией суммы в ячейках a и d. К сожалению, эта мера больше зависит от распространенности состояния, чем от повторяемости метода. Это потому, что на практике легко договориться о прямом отрицании; разногласия зависят от преобладания сложных пограничных случаев. Поэтому повторяемость обычно обобщается статистикой, которая измеряет уровень согласия сверх того, что можно было бы ожидать от распространенности признака.
Главы- Глава 1. Что такое эпидемиология?
- Глава 2. Количественная оценка заболеваемости в популяциях
- Глава 3. Сравнение показателей заболеваемости
- Глава 4. Ошибка измерения и погрешность
- Глава 5. Планирование и проведение исследования
- Глава 6. Экологические исследования
- Глава 7. Продольные исследования
- Глава 8. Исследования случай-контроль и перекрестные исследования
- Глава 9. Экспериментальные исследования
- Chapter 10. Screening
- Chapter 11. Outbreaks of disease
- Chapter 12. Reading epidemiological reports
- Chapter 13. Further reading
Measurement Error Definition
Measurement error in education generally refers to either ( 1) разница между тем, что показывает результат теста, и фактическими знаниями и способностями учащегося или (2) ошибки, допущенные при сборе и расчете основанных на данных отчетов, цифр и статистических данных, касающихся школ и учащихся.
Поскольку некоторая степень ошибки измерения неизбежна при тестировании и представлении данных, исследователи в области образования, статистики, специалисты по данным и разработчики тестов часто публично признают, что данные об успеваемости, такие как процент выпускников средней школы или уровень зачисления в колледжи, не являются абсолютно надежными. (они могут даже сообщать о «пределе погрешности» для данной статистики или результата) или что результаты тестов не всегда точно отражают то, что учащиеся знают или могут делать, т. приобретение знаний и навыков.
Ошибки измерения при тестировании могут быть вызваны целым рядом факторов, таких как психическое и эмоциональное состояние учащегося в период тестирования или условия, в которых проводился тест. Например, учащиеся могли быть необычно уставшими, голодными или эмоционально подавленными, или такие отвлекающие факторы, как громкие звуки, назойливые сверстники или технические проблемы, могли отрицательно сказаться на выполнении теста.
Ниже приведен репрезентативный список нескольких дополнительных факторов и проблем, которые могут привести к ошибке измерения при тестировании:
- Неоднозначно сформулированные вопросы или неточные ответы.
- Тестовые задания, вопросы и задачи могут не относиться к материалу, который учащиеся фактически преподавали.
- Уровни производительности и предельные баллы, например, те, которые считаются «проходными» или «уровнями» в конкретном тесте, могут быть ошибочными, плохо откалиброванными или искажающими.
- Процесс подсчета очков может быть плохо спроектирован, и ошибки могут совершаться как людьми, так и компьютерными системами подсчета очков.
- Администраторы тестов могут давать учащимся неправильные указания, помогать учащимся списывать или не создавать спокойных и благоприятных условий для прохождения теста.
- Данные результатов теста могут быть записаны и представлены неточно.
Ошибки измерения при представлении данных и статистики в области образования распространены и в большей или меньшей степени ожидаемы и неизбежны. В то время как человеческая ошибка может привести к неточным отчетам, системы данных и процессы по своей сути ограничены, т. е. просто невозможно создать совершенные системы данных или безупречно собирать данные, особенно по мере роста масштабов и масштабов систем. Национальные или общегосударственные системы данных — например, системы, управляемые государственными учреждениями для отслеживания важных образовательных данных, таких как количество выпускников средних школ, — особенно подвержены ошибкам измерения, учитывая огромные сложности, связанные со сбором данных из тысяч школ об успеваемости сотен школ. тысячи или миллионы студентов. По этой причине большинство крупномасштабных данных об образовании открыто квалифицируются как оценочные.
Ниже приводится репрезентативный список нескольких дополнительных факторов и проблем, которые могут привести к ошибкам измерения в образовательных данных:
- Ошибочные, неточные или неправильно организованные процессы сбора данных, приводящие к неправильным отчетам, записям, цифрам и статистике .
- Отсутствие четких и понятных правил, руководящих принципов и стандартов для процессов сбора данных и отчетности или двусмысленные руководящие принципы, которые приводят к неправильному толкованию и ошибкам.
- Небольшие размеры выборки — например, в сельских школах, в которых может быть небольшое количество учащихся и мало учащихся из числа меньшинств, — которые могут исказить восприятие успеваемости за определенные периоды времени, выпускные классы или группы учащихся.
- Различия в процессах сбора данных и представления данных, таких как уникальные системы сбора данных и требования, разработанные государствами, которые могут привести к неверным сравнениям или несовместимости систем, что приведет к ошибкам.
- Высокие показатели перевода в школьные системы и из них, например детей временных работников, затрудняют точное отслеживание статуса зачисления учащихся.
- Отсутствие соответствующей подготовки, опыта или технических знаний в области надлежащих процедур сбора данных и отчетности у лиц, ответственных за сбор и отчетность данных на уровне школы, округа и штата.
- Преднамеренное искажение информации об успеваемости и зачислении учащихся, например, такое, которое может сопровождать тестирование с высокими ставками.
Реформа
Хотя некоторая степень ошибки измерения является (и, возможно, всегда будет) неизбежной, многие преподаватели, школы, школьные округа, государственные учреждения и разработчики тестов предпринимают шаги для уменьшения ошибки измерения как при тестировании, так и при составлении отчетов.
При тестировании ошибка измерения обычно считается относительно незначительной проблемой для тестирования с низкими ставками, т. Е. Когда результаты тестирования не используются для принятия важных решений об учениках, учителях или школах. Однако по мере того, как ставки, связанные с эффективностью тестирования, растут, ошибка измерения становится более серьезной проблемой, поскольку результаты тестирования могут вызвать различные последствия. Ошибка измерения — одна из причин, по которой многие разработчики тестов и эксперты по тестированию не рекомендуют использовать один результат теста для принятия важных образовательных решений. Например, Стандарты образовательного и психологического тестирования — набор предлагаемых руководств, совместно разработанных Американской ассоциацией исследований в области образования, Американской психологической ассоциацией и Национальным советом по измерению в образовании — рекомендуют, чтобы «в начальном или среднем образовании решение или характеристика, которая окажет большое влияние на тестируемого, не должна автоматически строиться на основе одного балла за тест».
Ниже приведены несколько репрезентативных стратегий, которые преподаватели и разработчики тестов могут использовать для уменьшения ошибок измерения при тестировании:
- Разработчики тестов могут тщательно просматривать вопросы на предмет предвзятости и справедливости теста, а также удалять или пересматривать элементы, которые могут неблагоприятно повлиять на результаты тестирования. студенты разных рас, культурных групп или полов.
- Разработчики тестов могут проводить пилотные тесты, чтобы получить отзывы об уровнях сложности, ясности формулировок и предвзятости, а затем пересматривать тесты перед их проведением.
- Чтобы уменьшить количество ошибок при оценке человеком вопросов, которые не могут быть оценены компьютером, таких как вопросы с открытым ответом и эссе, два или более оценщиков могут оценивать каждый элемент или эссе. Если они не согласны, вопрос может быть передан дополнительным оценщикам.
- Школы могут ужесточить меры безопасности для борьбы с мошенничеством и предотвращения мошенничества со стороны тех, кто проводит тесты и сдает их.
- Разработчики политики могут снизить или устранить последствия, связанные с результатами тестов, чтобы свести к минимуму завышение оценок и снизить мотивацию к манипулированию результатами.
- Вместо того, чтобы полагаться на один потенциально неточный показатель, школы могут получить более полную информацию, используя несколько методов для оценки достижений учащихся и успеваемости.
При сборе данных и отчетности в области образования ошибка измерения также может стать серьезной проблемой, особенно когда на уровень финансирования школы, штрафы или восприятие успеваемости влияют общедоступные данные, такие как, например, процент отсева или процент выпускников. По этим и другим причинам повышение качества и точности систем данных, процессов сбора и требований к отчетности становится растущим приоритетом для школ, политиков и государственных учреждений, а также различных организаций и инициатив, таких как Кампания за качество данных. и Общие стандарты данных об образовании работают над улучшением качества, согласованности и надежности данных об образовании.
Ниже приведены несколько репрезентативных стратегий, которые преподаватели и эксперты по данным могут использовать для уменьшения ошибок измерения при представлении данных:
- «Уникальные идентификаторы учащихся», такие как коды, отслеживание отдельных учащихся и повышение надежности данных по мере их перехода из класса в класс или из школы в школу.