Стандартным дизайном для исследований биоэквивалентности, который позволяет снизить внутрииндивидуальную вариабельность, является рандомизированное, перекрестное исследование (Crossover 2×2). Расчет объема выборки для исследования биоэквивалентности является важной частью планирования исследования и должен быть обоснован. Целью данной работы является реализация и валидация алгоритма определения необходимого объема выборки для исследований биоэквивалентности с помощью компьютерной симуляции. Предлагаемый алгоритм основан на процедуре определения мощности статистического теста при известных значениях количества наблюдений, вариации и заданного значения допустимого уровня ошибки первого рода.
Введение
Исследование биоэквивалентности лекарственного препарата – вид клинического исследования, проведение которого осуществляется для определения скорости всасывания и выведения одного или нескольких обладающих фармакологической активностью действующих веществ, количества лекарственного препарата, достигающего системного кровотока, и результаты которого позволяют сделать вывод о биоэквивалентности тестируемого лекарственного препарата в определенных лекарственной форме и дозировке, соответствующих форме и дозировке референтного лекарственного препарата[1].
Для определения скорости и степени абсорбции в исследованиях биоэквивалентности используется кривая «концентрация-время». Следующие фармакокинетические параметры и заранее установленные границы допустимых отклонений позволяют судить о биоэквивалентности сравниваемых лекарственных препаратов:
Рисунок 1 Фармакокинетический профиль
AUC (Area Under the Curve – площадь под кривой̆ «концентрация-время») отражает степень воздействия (экспозиции). Сmах (максимальная концентрация в плазме) и Tmax (время достижения максимальной̆ концентрации в плазме крови) являются параметрами, на которые влияет степень абсорбции (См. Рис . 1). Как правило, для подтверждения биоэквивалентности выполняется расчет двухстороннего 90%-го доверительного интервала для отношения средних геометрических параметров AUC и Сmах, границы которого должны находиться в пределах 80.00 – 125.00% [2-4, 6]. (прим. Обычно для изучения параметров фармакокинетики определяется концентрация активного вещества исследуемого лекарственного препарата в плазме крови, однако, в отдельных случаях определение может выполняться в цельной крови, либо в качестве аналита могут выступать метаболиты активного вещества.)
Признание биоэквивалентности лекарственных средств позволяет экстраполировать данные доклинических и клинических исследований референтного препарата по безопасности и эффективности на тестируемый. Наиболее часто исследования биоэквивалентности используются для регистрации воспроизводимых лекарственных средств (дженериков). Однако, не редкими являются случаи использования исследований биоэквивалентности для регистрации новых форм лекарственных препаратов и нового состава (при его изменении) лекарственного средства.
Исследования биоэквивалентности лекарственных препаратов выделяются среди других клинических исследований особенностями проведения (необходимость одновременной работы нескольких врачей, медсестер и ассистентов, с рассчитанным по секундам графиком) и тщательностью планирования, от которого напрямую зависит успех или неудача исследования. Определение объема выборки для проведения исследования биоэквивалентности является результатобразующей частью планирования исследования наряду с выбором дизайна и определения временных точек фармакокинетического профилирования. Учитывая возможности вычислительной техники на текущий момент, вне всякого сомнения является целесообразным использование компьютерного моделирования для определения объема выборки.
В соответствии с рекомендациями ФГБУ «НЦЭСМП» и правилами проведения исследований биоэквивалентности лекарственных препаратов в рамках Евразийского экономического союза количество субъектов, включенных в исследование, должно определяться соответствующими расчетами объема выборки. Количество включенных в анализ субъектов исследования биоэквивалентности при этом должно быть не менее 12 [2, 3]. Основанием для определения параметров расчета объема выборки могут быть рекомендации управления по контролю пищевых продуктов и медикаментов США (аббревиатура в англоязычной литературе FDA) [4], а расчет выборки должен быть выполнен с использованием опубликованных формул расчета или с использованием симуляционных данных. При этом, в качестве параметров расчета необходимо учесть ошибку первого рода α ≤ 0.05, мощность (1 – β) 80 или 90%, допущение о том, что оцененное значение отношения изучаемых фармакокинетических параметров может отклоняться на величину до 5%, а также вариацию оцениваемых параметров.
Стандартные методы расчета
Стандартным дизайном для исследований биоэквивалентности, который позволяет снизить внутрииндивидуальную вариабельность, является рандомизированное, двухпериодное, перекрестное в двух последовательностях исследование (в англоязычной литературе – Crossover 2×2). При таком дизайне каждый пациент является контролем самому себе, так как индивидуальные особенности метаболизма одинаково влияют на биодоступность тестируемого и референтного препарата.
Для клинического исследования биоэквивалентности, проводящегося по стандартному дизайну, расчет объема выборки может быть выполнен с помощью выражения (1):
Где – σ2 остаточная внутрииндивидуальная вариация, Δ – максимальные допустимые различия (Δ = ln(1.25) для стандартного интервала 80-125%), t(α, 2n – 2) и t(β, 2n – 2) значения коэффициента Стьюдента при значении ошибки I рода α, ошибки II рода β и количестве степеней свободы df = 2n – 2, θ = ln(μT / μR) = ln(μT) – ln(μR) предполагаемое различие средних значений логарифмически преобразованных параметров (AUC, Сmах)[5]. В соответствии с рекомендациями FDA может быть принято как θ = ln(0.95) = -0.0513.
При этом значение σ2 может быть определено выражением (2).
Где CV – коэффициент внутрииндивидуальной вариации[6].
При расчете с помощью выражения (1) следует учесть, что значение коэффициента Стьюдента t(α, df) и t(β, df) зависит от количества субъектов n, следовательно, расчеты необходимо проводить итеративно до момента, когда левая и правая часть выражения будут соответствовать друг другу. Для оптимизации процесса определения объема выборки может быть использовано специализированное программное обеспечение. Так, необходимые вычисления можно выполнить, используя программную среду вычислений R project с установленным пакетом «PowerTOST: Power and Sample Size Based on Two One-Sided t-Tests (TOST) for (Bio)Equivalence Studies» при помощи функции sampleN.TOST. Данная функция поддерживает алгоритмы расчета выборки на основе Owen’s Q функции, нецентрального распределения Стьюдента (noncentral t-distribution) и распределения Стьюдента (central t-distribution)[7,8]. По умолчанию расчет размера выборки выполняется на основе Owen’s Q функции.
Механизм симуляции
Целью данной работы является разработка и валидация алгоритма определения необходимого объема выборки с помощью компьютерной симуляции. Определение объема выборки тесно связано с методами симуляционного определения мощности статистического теста. Предлагаемый алгоритм основан на процедуре определения мощности статистического теста при известных значениях количества наблюдений, вариации и заданного значения допустимого уровня ошибки первого рода и имеет аналогичное целевое назначение функции power.TOST.sim (D. Labes), входящей в состав пакета PowerTOST для среды вычислений R project[8].
Мощность статистического теста определяется как доля симуляций завершившихся положительно относительно общего количества симуляций. Под симуляцией понимается процедура генерации данных на основе заданных значений вариации и количества наблюдений с последующей статистической оценкой. Для определения объема выборки выполняются симуляции с использованием увеличивающихся значений числа наблюдений до момента, когда полученная мощность не будет удовлетворять заданным условиям. Количество симуляций должно быть достаточным для расчета мощности с приемлемой точностью и обычно составляет не менее 105 симуляций для каждой итерации.
Рисунок 2. Графическая схема алгоритма определения необходимого объема выборки на примере расчета с целевым значением мощности 80.00%.
Генерация данных
В ходе каждой симуляции определяется стандартная ошибка (SE) и Ln(Ratio) на основании которых рассчитывается доверительный интервал. Определение SE осуществляется на основании известного коэффициента внутрииндивидуальной вариации (CV) исследуемых параметров (AUC, Сmах) и числа наблюдений (n) в соответствии с выражением (3) c допущением, что число наблюдений в группах равно (n = n1 + n2; n1 = n2).
Генерация Ln(Ratio) осуществляется на основании SE и θ–ожидаемой величины отношения(ln(μT / μR)) (выражение 4).
Где, θ = ln(μT / μR), X – нормально распределенная случайная величина с математическим ожиданием равным 0 и стандартным отклонением равным 1 генерируемая с помощью полярного метода [9,10] для каждой симуляции.
Для определения мощности необходимо проведение симуляции с учетом моделирования изменчивости самой вариации, которая обладает свойствами случайной величины, распределенной в соответствии с χ2 (хи-квадрат) распределением (доверительный интервал которой можно определить с помощью выражения 5 )[11].
Генерация значения вариации выполняется при помощи выражения 6.
Где χ2df– генерированная[12] случайная величина распределенная в соответствии с хи-квадрат распределением с df степенями свободы. SEsim вычисляется как и SE, за исключением того, что вместо σ2 используется значение σ2sim полученное с помощью генерации.
Статистическая проверка
После определения значений Ln(Ratio) и SEsim происходит вычисление границ 90% доверительного интервала с помощью выражений (7) и (8).
В случае если CI90%lower > 80.00% и CI90%upper < 125.00% симуляция считается положительно завершившейся. Для определения мощности проводится серия из 106 симуляций, после чего рассчитывается мощность, как доля успешных симуляций относительно общего количества симуляций. Расчет симуляций начинается с использования минимальных значений n и выполняется до момента, когда рассчитанная в серии симуляций мощность удовлетворит заданным условиям (в большинстве случаев > 80.00%).
Валидация
Валидация представленного метода проведена с помощью сравнения значений полученных с помощью симуляции, и значений, полученных с помощью вычисляемых формул. Для сравнения мощности использовалась функция power.TOST (alpha = 0.05, theta0 = 1.0, CV=CV*, n=N*, design = “2×2″). Для определения объема выборки была использована функция sampleN.TOST(alpha=0.05, targetpower=0.8, theta0=Ratio*, CV=CV*, design=”2×2”). Значения CV, N, Ratio и результаты расчета представлены в таблице 1. Для значения мощности (Power) было рассчитано среднее значение и стандартное отклонение различия (Diff) мощности, полученной как результат вычислений и симуляции.
CV (%) | Ratio = 1.0 | Ratio = 1.0 | Ratio = 0.95 | |||||||||
N =18 | N = 24 | Sim | R | Sim | R | |||||||
Sim | R | Sim | R | N | Power | N | Power | N | Power | N | Power | |
15 | 0.991611 | 0.992040 | 0.999250 | 0.999249 | 121 | 0.9209951 | 10 | 0.838554 | 12 | 0.830435 | 12 | 0.830516 |
16 | 0.982527 | 0.982639 | 0.997790 | 0.997794 | 12 | 0.878385 | 12 | 0.878346 | 14 | 0.848608 | 14 | 0.848665 |
17 | 0.968106 | 0.968127 | 0.994650 | 0.994700 | 12 | 0.827652 | 12 | 0.827341 | 14 | 0.805729 | 14 | 0.805683 |
18 | 0.947474 | 0.947502 | 0.989008 | 0.989100 | 14 | 0.856959 | 14 | 0.857588 | 16 | 0.819837 | 16 | 0.820357 |
19 | 0.920581 | 0.920559 | 0.980205 | 0.980154 | 14 | 0.807976 | 14 | 0.808599 | 18 | 0.828923 | 18 | 0.829371 |
20 | 0.887733 | 0.887592 | 0.967319 | 0.967190 | 16 | 0.832995 | 16 | 0.833200 | 20 | 0.835178 | 20 | 0.834680 |
21 | 0.849408 | 0.849268 | 0.949997 | 0.949800 | 18 | 0.848674 | 18 | 0.849268 | 22 | 0.837363 | 22 | 0.837437 |
22 | 0.806831 | 0.806478 | 0.927918 | 0.927864 | 18 | 0.805836 | 18 | 0.806478 | 22 | 0.804357 | 22 | 0.804007 |
23 | 0.760676 | 0.760209 | 0.901705 | 0.901528 | 20 | 0.820907 | 20 | 0.820764 | 24 | 0.806528 | 24 | 0.806653 |
24 | 0.711982 | 0.711454 | 0.871449 | 0.871149 | 22 | 0.831253 | 22 | 0.830579 | 26 | 0.808002 | 26 | 0.807666 |
25 | 0.661585 | 0.661146 | 0.837526 | 0.837226 | 24 | 0.837436 | 24 | 0.837226 | 28 | 0.807813 | 28 | 0.807439 |
26 | 0.610297 | 0.610138 | 0.800673 | 0.800342 | 24 | 0.800524 | 24 | 0.800342 | 30 | 0.806167 | 30 | 0.806253 |
27 | 0.559623 | 0.559195 | 0.761618 | 0.761106 | 26 | 0.806714 | 26 | 0.806729 | 32 | 0.803859 | 32 | 0.804311 |
28 | 0.509476 | 0.508998 | 0.720493 | 0.720116 | 28 | 0.811367 | 28 | 0.811031 | 34 | 0.802288 | 34 | 0.801769 |
29 | 0.460474 | 0.460154 | 0.678428 | 0.677934 | 30 | 0.813856 | 30 | 0.813724 | 38 | 0.819820 | 38 | 0.820187 |
30 | 0.413843 | 0.413193 | 0.635609 | 0.635066 | 32 | 0.814832 | 32 | 0.815152 | 40 | 0.815616 | 40 | 0.815845 |
Diff (M±SD) | 0.000221±0.000287 | 0.000208±0.000208 | -0.000067±0.000415 | -0.000020±0.000345 |
1 – Отличающееся значение получено в ходе симуляции в связи с тем, что минимальное количество субъектов для симуляции было принято как ≥ 12, данное значение не учитывалось при расчете различий.
Данные сравнения свидетельствуют о высокой сопоставимости результатов вычисления и симуляции. Значения расчетов объема выборки полностью сопоставимы.
Расширенные методы симуляции
Описанный подход обладает рядом ограничений. Так, предполагается, что вариация данных не зависит от таких факторов как: препарат, период и последовательность. В случае если возникает необходимость генерации данных с учетом гетерогенности вариации, может использоваться подход, основанный на генерации полного набора данных (т.е. данных субъектов), для последующего вычисления вариации и доверительного интервала. В этом случае, для каждого субъекта генерируется пара случайных величин в соответствии с выражением (9):
Где YT, YR– величина эффекта для тестируемого и референтного препарата, X – случайная нормально распределенная величина, генерируемая для каждого измерения каждого субъекта, θ – ожидаемая величина отношения (ln(μT / μR)). После этого на основе сгенерированного массива данных проводится расчет вариации c помощью выражения (10) и вычисление доверительного интервала:
где: j – субъект, i – последовательность.
Под значением величины эффекта понимается логарифмически преобразованный показатель изучаемого фармакокинетического параметра (AUC, Сmах).
Расчет мощности проводится аналогично описанному выше методу. В общем случае генерация данных проводится только для значения остаточной вариации, однако, для расширенного анализа возможна генерация данных согласно полной модели вариации с включением влияния вариации, обусловленной периодом, препаратом, последовательностью.
Заключение
В представленной статье приведен пример подходов к расчету мощности и необходимому объему выборки для проведения рандомизированного, двухпериодного, перекрестного в двух последовательностях исследования биоэквивалентности на основе вычислений с помощью опубликованных формул, специализированного программного обеспечения и алгоритмов симуляции. Указанные методы позволяют провести расчет выборки для исследований биоэквивалентности на основании предположения об остаточной вариации данных, различия тестируемого и референтного препаратов, мощности и величины ошибки первого рода. Однако, для прогнозирования и планирования исследований может использоваться подход, использующий процедуру симуляции, основанную на генерации данных на уровне субъектов исследования. Данный подход может позволить включить в модель изучение влияния других факторов, а также учитывать возможную гетерогенную вариацию для тестируемого и референтного препаратов, расширив инструментарий прогнозирования для исследователей. Исходные коды алгоритмов симуляции и данные валидации размещены на сайте github.com[13]. Для генерации случайных величин была использована библиотека Colt 1.2.0 (cern.jet.random)[14].
Авторы: Арнаутов В.С., Рейхарт Д.В., Борисов А.С.
Этот текст подавался и был опубликован в журнале: Химико-фармацевтический журнал. Том 51, №7, 2017.
- Федеральный закон от 12.04.2010 N 61-ФЗ (ред. от 03.07.2016) “Об обращении лекарственных средств” (с изм. и доп., вступ. в силу с 01.01.2017)
- Руководство по экспертизе лекарственных средств. Том I. — М.: Гриф и К, 2014 —328 с. ISBN 978-5-8125-1858-5
- Правила проведения исследований биоэквивалентности воспроизведенных лекарственных препаратов в Евразийском Экономическом Союзе (Версия 4.1 от 16.06.2015)
- Guidance for industry: Statistical Approaches Establishing Bioequivalence (2001) prepared by the Population and Individual Bioequivalence Working Group of the Biopharmaceutics Coordinating Committee in the Office of Pharmaceutical Science, Center for Drug Evaluation and Research (CDER) at the Food and Drug Administration (FDA)
- On Sample Size Calculation in Bioequivalence Trials – Shein-Chung Chow and Hansheng Wang – Journal of Pharmacokinetics and Pharmacodynamics, Vol. 28, No. 2, 2001
- Diletti, D. Hauschke, and V. W. Steinijans. Sample size determination for bioequivalence assessment by means of confidence intervals. Int. J. Clin. Pharm. Ther. Toxicol. 19:1–8 (1991)
- Owen, D.B. “A Special Case of a Bivariate Non-central t-distribution” Biometrika, 52, 437 -446. (1965)
- PowerTOST: Power and Sample Size Based on Two One-Sided t-Tests (TOST) for (Bio)Equivalence Studies reference manual v.1.4-4 2017-03-15 (https://cran.r-project.org/web/packages/PowerTOST/index.html)
- A convenient method for generating normal variables, G. Marsaglia and T. A. Bray, SIAM Rev. 6, 260–264, 1964
- Donald E. Knuth in The Art of Computer Programming, Volume 3: Seminumerical Algorithms, section 3.4.1, subsection C
- David J. Sheskin, Handbook of Parametric and Nonparametric Statistical Procedures, Fourth Edition, IBSN:1584888148
- F. Monahan (1987): An algorithm for generating chi random variables, ACM Trans. Math. Software 13, 168-172
- https://github.com/PharmCat/Bioequivalence
- http://dst.lbl.gov/ACSSoftware/colt/