Оценка данных вариации литературных источников для определения объема выборки клинических исследований биоэквивалентности

Определение объема выборки – важный шаг планирования клинического исследования биоэквивалентности. Так как вариация исследуемого параметра является определяющим показателем для прогнозирования необходимого объема выборки, необходимо предусмотреть при планировании использование такой оценки, которая учитывает весь  возможный (или как можно больший) объем данных о вариации.

Как много раз было написано и сказано, определение объема выборки это важный шаг планирования клинического исследования биоэквивалентности. Основной параметр, влияющий на объем выборки – вариация (внутри-индивидуальная для перекрестных исследований, меж-индивидуальная для исследования в параллельных группах). Основные источники данных о вариации – опубликованные работы по проведенным фармакокинетическим исследованиям, а также результаты собственных ранее проведенных исследований по изучению фармакокинетики. К сожалению, второй источник встречается не очень часто, таким образом, как правило, при подготовке исследования приходится использовать данные литературы. Естественно, что желательно учитывать весь объем имеющихся литературных данных. Поэтому для получения итоговой оценки необходимо определиться с процедурами поиска, отбора источников и процедурой обобщения данных. Фактически, в каждом таком случае речь идет о мета-анализе для определения обобщенной оценки вариации. Процесс отбора исследований и выполнения анализа желательно формализовать и описать, при этом эти процедуры зависят от конкретного случая, от качества источников и их количества. В случае отсутствия источников или малого их количества, само проведение такого анализа может быть сомнительно. К примеру, поиск выявил 2 источника: один качественный источник с детализированными данными, второй сомнительный. Следует ли проводить в таких случаях обобщение? Не существует однозначного ответа на этот вопрос, но автор мета-анализа должен учитывать, что в определенных случаях результат такого обобщения может оказаться менее достоверным, чем результат отдельного исследования.

Данные литературы не подчиняются каким-либо требованиям по полноте предоставления данных (вероятно потому, что таких требований нет), в связи с этим, во многих случаях невозможно установить реальную картину исследования (данные концентраций не опубликованы, данные индивидуальных параметров не опубликованы, не опубликованы данные по вариации).

Итак, возможно выделить два основных источника данных для анализа: индивидуальные данные фармакокинетических параметров нескольких исследований и данные непосредственно о самой вариации наблюдавшейся в исследованиях. При наличии известных индивидуальных параметров субъектов нескольких исследований возможно проведение обобщенной оценки вариации, для чего применима модель со смешанными эффектами, в которую введен фактор “исследование” – такая оценка обобщенной вариации может быть наиболее точной/правильной, но и самой редкой (в связи с отсутствием индивидуальных данных). Дизайн модели и выбор ковариационной структуры в этом случае должен отражать вариационную особенность данных ( модель должна быть обоснована, обоснованием может служить как  фактическая структура данных (здравый смысл), так и данные информационных критериев, при этом не стоит опираться исключительно на данные информационных критериев, так как использование ковариационных матриц противоречащих структуре данных может привести к получению неверных результатов).

В случае если известны только итоговые данные вариации по отельным исследованиям, следует определить, какие источники могут войти в анализ. Зачастую коэффициент вариации может быть получен косвенно на основании значений доверительного интервала и количества участников исследования. В этом случае следует понимать, что оценка вариации вычисляется на основе предположений о численности групп (если количество участников в каждой группе не указано), но такое предположение может не соответствовать реальности и полученное значение может несколько отклоняться от данных полученных в исследовании. Также источники могут отличаться особенностями популяции, если известно, что вариация исследуемого параметра зависит от демографических характеристик, то в этом случае следует предусмотреть критерии отбора исследований. Желательно отбирать исследования, в которых характеристики популяции максимально соответствуют планируемой. Следует отметить, что само по себе исключение из мета-анализа данных исследований с участием субъектов, характеристики которых (раса, пол и т.д.) отличаются от планируемой популяции без подтвержденного основания может привести к смещению оценки. Это может произойти в связи с тем, что в итоговую популяцию планируемого исследования могут войти различные группы участников (когда это отдельно не регламентируется критериями включения). С другой стороны, в случае исключения маргинальных значений при учете того, что реальной связи с критерием исключения таких данных нет – это ведет к смещению результата в противоположенную сторону.

Таким образом, мета-анализ для изучения вариации может быть выполнен с использованием:

  • Индивидуальных данных с последующим анализом;
  • Оценок вариации проведенных исследований;
  • Смешанный анализ (если в этом есть смысл).

Перед включением исследований в мета-анализ необходимо определить критерии отбора исследований, к примеру:

  • Популяция субъектов (количество, демографические характеристики);
  • Дизайн исследования;
  • Полнота данных исследования (вариация указана явно, или определена приблизительно).

Когда отбор исследований выполнен объединенная оценка (Pooled variance) может быть получена при помощи выражения[1]:

Доверительный интервал для объединенной оценки может быть рассчитан при помощи следующих выражений:

Смотри также David J. Sheskin, Handbook of Parametric and Nonparametric Statistical Procedures.

Для вычисления объединенного значения вариации может быть использован пакет ClinicalTrialUtilities для среды вычислений Julia или пакет PowerTOST для среды вычислений R.