Когортный анализ (анализ групп) исследований биоэквивалентности

Несмотря на то, что статистический анализ клинических исследований достаточно хорошо описан и регламентирован, со стороны экспертов регуляторных инстанций периодически возникают идеи о дополнениях к устоявшимся методам. Одна из таких идей заключается в необходимости обоснования отсутствия анализа групп при не одновременном включении добровольцев в исследование. С одной стороны, регулятор не выдвигает требований по обязательному включению дополнительного фактора когорты/группы в статистический анализ, с другой стороны требует обоснования в случае его отсутствия. Особенно украшает ситуацию то, что требования к проведению подобного анализ отсутствуют (справедливо отметить, что это касается всех регуляций: РФ, FDA и EMA). Также не ясно, что именно подлежит анализу. Полученные данные фармакокинетики, их прологарифмированные значения,  или же речь идет о демографических данных? — четкого указания нет. Попробуем остановиться на том, что дополнительный анализ надо проводить для прологарифмированных данных фармакокинетических параметров на основании которых выполняется заключение о биоэквивалентности. Должен ли это быть отдельный анализ? Иле все же этот фактор необходимо внести в главную статистическую модель? Отдельный анализ представляется абсурдным — в этом случае в модель не будут включены прочие факторы, а следовательно и их возможные взаимодействия, что не позволит разделить влияние таких факторов как последовательность и группа, а следовательно полученные результаты не могут подлежать адекватной оценки. С этой позиции фактор группы необходимо включать в главную статистическую модель.

Попробуем разобраться как это сделать. По всем рекомендациям базовая статистическая модель для биоэквивалентности выглядит следующим образом:

formulation + period + sequence + subject(sequence)

где:

formulation — препарат (T/R)

period — период (1/2)

sequence — последовательность (TR/RT)

subject(sequence) — субъект (в последовательности)

Почему субъект в последовательности? Потому что каждый субъект может находиться только в одной последовательности. Что это значит для исследования биоэквивалентности? То что вариации субъектов разных последовательностей фактически будут рассчитаны раздельно, еще это означает, что среднее значение параметра будет рассчитываться как среднее между средними значениями в каждой последовательности. Это важно понимать, т.к. именно эта особенность делает возможным анализ данных который устойчив к отсутствию баланса между последовательностями.  В этом заключается основной принцип перекрестного дизайна.

А теперь попробуем внести в  модель дополнительный фактор «группа» — group. Опустим обоснование для включения этого фактора и просто внесем его в модель. Внесение фактора группы  в модель совершенно обосновано в случае двухэтапного дизайна. При этом фактор изначально обозначен в протоколе, существует конкретное продолжительное время между проведением каждого этапа. При этом по завершению этапа проводятся биоаналитические процедуры и промежуточный анализ. Уже это является достаточным и веским основанием включить такой фактор в модель.

EMA нам говорит следующее:

  1. The expected analysis for the combined data in a two-stage design is ANOVA with terms for stage, sequence, sequence*stage, subject (sequence*stage), period (stage), formulation.
  2. This model can be fitted provided that in each stage, there is at least one subject randomized to each sequence. This does not supersede the requirement for at least 12 subjects overall.
  3. A term for a formulation*stage interaction should not be fitted
Т.е. модель приобретает следующий вид:

group + sequence+ formulation + period(group) + sequence*group + subject(sequence*group)

Отметим, что модель обогащается кросс-фактором sequence*group и вложенным period(group), общий фактор period исключается, а субъект становится вложенным в sequence*group. В целом, достаточно логично и можно было бы ожидать наличие formulation*group, но по рекомендации этот фактор исключён исходя из положения, что включение этого фактора приведет к тому, что веса двух этапов станут равными, и это может привести к неправильной интерпретации данных. Этот пример необходим для понимания как может формулироваться модель с включением дополнительного фактора — group (Анализ возможен если в каждом этапе есть как минимум 1 субъект в каждой последовательности).

Что говорит FDA по данному вопросу? Официально ничего кроме:

If a crossover study is carried out in two or more groups of subjects (e.g., if for logistical reasons only a limited number of subjects can be studied at one time), the statistical model should be modified to reflect the multigroup nature of the study. In particular, the model should reflect the fact that the periods for the first group are different from the periods for the second group. This applies to all of the approaches (average, population, and individual BE) described in this guidance.

If the study is carried out in two or more groups and those groups are studied at different clinical sites, or at the same site but greatly separated in time (months apart, for example), questions may arise as to whether the results from the several groups should be combined in a single analysis.

Уважаемый Гельмут приводит нам такие сведения полученые «under FOI» от FDA:

  1. Group, Sequence, Treatment, Subject (nested within Group × Sequence), Period (nested within Group), Group-by-Sequence Interaction, Group-by-Treatment Interaction.
    Subject (nested within Group × Sequence) is a random effect and all other effects are fixed effects. Note that intra-subject contrasts for the estimation of the treatment effect (and hence, a PE and its CI) cannot be unbiased obtained from this model. It serves only as a decision tool.

    • If the Group-by-Treatment interaction test is not statistically significant (p ≥0.1), only the Group-by-Treatment term can be dropped from the model. That means, pool the data and evaluate the study by model #2.
    • If the Group-by-Treatment interaction is statistically significant (p <0.1), equivalence has to be demonstrated in one of the groups, provided that the group meets minimum requirements for a complete bioequivalence study. That means, no pooling and evaluate the (largest) group only by model #3.
  2. Group, Sequence, Treatment, Subject (nested within Group × Sequence), Period (nested within Group), Group-by-Sequence Interaction.
    Again, Subject (nested within Group × Sequence) is a random effect and all other effects are fixed effects.
    The model takes the multigroup nature of the study into account and is more conservative than the native pooled model (three degrees of freedom less than model #3).
  3. Sequence, Treatment, Period, Subject (nested within Sequence).
    Surprise: Subject (nested within Group × Sequence) is a random effect and all other effects are fixed effects.

However, the FDA also states that the simple model #3 (of pooled data) can be applied if all of the following criteria are met:

  • the clinical study takes place at one site,
  • all study subjects have been recruited from the same enrollment pool,
  • all of the subjects have similar demographics, and
  • all enrolled subjects are randomly assigned to treatment groups at study outset.

По материалам http://bebac.at (Helmut Schütz).

Здесь видим 3 подхода, которые очень похожи на тот, что применяет EMA для двухэтапного исследования, за исключением того, что в модель #1 все же может вноситься фактор formulation*group. Тогда она приобретает вид:

group + sequence+ formulation + period(group) + sequence*group + formulation*group + subject(sequence*group)

При этом допускается исключение фактора formulation*group в случае, если его значимость недостаточна (т.е. при p ≥ 0.1). А если его значимость существенна, то такие данные говорят о том, что биоэквивалентность необходимо показать на одной из групп. При этом модель #1 подходит только для целей обсуждения.

Пример #2 — идентичен подходу от EMA.

Пример #3 — классическая модель биоэквивалентности.

При этом есть очень важное дополнение! При соблюдении следующих правил анализ групп не проводится:

  • исследование проводится в одном центре;
  • субъекты набираются из единого пула добровольцев;
  • все субъекты демографически схожи и
  • все субъекты случайно распределены в группы (лечения) в начале исследования (вероятно это трактуется как набор без значимого перерыва в рандомизации).

Что все это означает? Действительно возможно включение фактора группы/когорты в статистическую модель. Но данное включение должно быть обосновано и пройти следующие этапы принятия решения:

Если исследования проводилось в одном центре, субъекты набирались из общего пула, не выявлено демографических различий,  случайное распределение добровольцев по группам проводилось на начальном этапе, а интервал включения не существенный (к примеру не более месяца, см. пример FDA). То дополнительный фактор не вносится в модель и анализ выполняется по классической модели #3.

Если эти условия не выполняются, то сперва выполняется оценочный анализ с использованием модели #1; в случае если значимость фактора formulation*group не значительна, то фактор исключается из анализа и модель приводится к #2 — по которой выполняется финальный анализ. В случае если formulation*group значим, то анализ выполняется по классической модели на одной из групп.

Остаются вопросы на которые хотелось бы получить внятные ответы:

1. По рекомендациям EMA внесение фактора group возможно если каждая группа содержит хотя бы по одному субъекту из каждой последовательности. Логично не проводить подобный анализ (либо не выделять такую группу) в случае если в  группе не более 1 человека или все субъекты принадлежат одной последовательности (фактор группы в данном случае «вливается» в последовательность). Так ведь?

2. Если количество групп более 2х и на этапе #1 было выявлено влияние formulation*group, значит ли это, что надо проводить анализ в одной из этих групп или возможно исключить группу влияние которой приводит к выявлению значимого фактора formulation*group. Логично исключить одну группу по рузультатам post hoc. Так ведь?

3. При возможном распределении 12 + 1 + 11  (или 12 + 11 + 1 ), в какую группу определять еденичного субъекта. Без вариантов ответа.

Update:

Есть, конечно, рекомендации ЕАЭС. Но они ясности существенно не добавляют:

  1. Если перекрестное исследование проведено в 2 и более группах субъектов, т.е. разбиение всей выборки на несколько групп, каждая из которых начинает участие в исследовании в разные дни (например, если из логистических соображений единовременно в клиническом центре можно провести исследование с участием ограниченного числа субъектов), в целях отражения многогруппового характера исследования необходимо модифицировать статистическую модель. В частности, в модели необходимо учесть тот факт, что периоды для первой группы отличаются от периодов для второй (и последующих) группы.
  2. Если исследование проведено в двух и более группах и эти группы изучались в различных клинических центрах или в одном и том же центре, но были разделены большим промежутком времени (например, месяцами), возникает сомнение относительно возможности объединения результатов, полученных этих группах, в один анализ. Такие ситуации необходимо обсуждать с уполномоченным органом. Если предполагается проведение исследования в нескольких группах из логистических соображений, об этом необходимо явно указать в протоколе исследования; при этом, если в отчете отсутствуют результаты статистического анализа, учитывающие многогрупповой характер исследования, необходимо представить научное обоснование отсутствия таких результатов.