Target Trial Emulation(TTE)은 최근 관찰연구에서 가장 자주 등장하는 표현 중 하나입니다. 하지만 이 개념은 단순히 유행하는 통계기법의 이름이 아닙니다. 오히려 "관찰자료를 분석하기 전에, 내가 원래 하고 싶었던 임상시험을 먼저 문장으로 쓰라"는 요구에 가깝습니다.
이 차이는 생각보다 큽니다. 왜냐하면 많은 관찰연구가 데이터는 풍부하지만 질문은 흐린 상태로 시작되기 때문입니다.
왜 필요한가
관찰연구는 데이터가 풍부한 대신 연구 시작점이 흔들리기 쉽습니다. 치료군은 약을 시작한 날부터 추적하지만, 비교군은 진단일 또는 등록일에서 시작하는 식의 비대칭이 자주 생깁니다. 같은 질문을 묻는 것처럼 보여도 실제로는 출발선이 다릅니다.
이런 문제는 결과를 해석할 때 큰 부담이 됩니다. time zero가 어긋나고, comparator가 임상적으로 대칭적이지 않고, baseline 측정 기간이 다르면, 뒤에서 아무리 정교한 보정을 해도 이미 설계가 흔들린 상태일 수 있습니다.
TTE는 이런 흔들림을 줄이기 위해 등장한 프레임입니다. 핵심은 간단합니다.
"실제로 무작위 배정 임상시험을 할 수 있었다면, 나는 어떻게 설계했을까?"
이 질문을 먼저 쓰고, 그 설계를 관찰자료로 최대한 흉내 내는 것입니다.
핵심 설계 요소
Target trial을 문장으로 쓰려면 최소한 아래 요소들을 명시해야 합니다.
- 적격성 기준(eligibility criteria)
- 치료 전략(treatment strategies)
- comparator
- 추적 시작점(start of follow-up)
- 결과(outcome)
- causal contrast
- 분석계획(analysis plan)
이 요소들은 겉보기에 당연해 보이지만, 실제 관찰연구에서는 이 중 하나라도 흐려지는 순간 해석이 불안해집니다.
예를 들어 comparator가 명확하지 않으면 "무엇과 무엇을 비교하는가" 자체가 흔들립니다. 추적 시작점이 대칭적이지 않으면 immortal time bias가 생길 수 있습니다. causal contrast가 ITT에 가까운지 per-protocol에 가까운지 설명하지 않으면, 같은 hazard ratio라도 의미가 달라집니다.
실무에서 자주 부딪히는 문제
실제 데이터에서는 처방일과 복용 시작일이 다를 수 있고, comparator가 완전히 대칭적이지 않을 수 있습니다. grace period, washout window, baseline lookback을 대칭적으로 설계하지 않으면 TTE의 외형만 남고 bias는 그대로 남습니다.
실무에서는 특히 다음 같은 문제가 자주 보입니다.
1. 치료 시작 시점이 깔끔하지 않다
청구자료에서 처방일은 보이지만 실제 복용 시작은 다를 수 있습니다. EHR에서는 order가 남아도 실제 dispensation은 따로일 수 있습니다. 이때 어떤 날짜를 index date로 잡을지 명확히 정하지 않으면, 연구의 시작점이 흔들립니다.
2. comparator가 임상적으로 비대칭적이다
이상적인 active comparator가 있지만 실제 데이터에서 표본이 부족한 경우가 있습니다. 이럴 때 연구자는 non-user로 내려가고 싶은 유혹을 받게 됩니다. 하지만 그 순간 비교는 훨씬 더 불공정해질 수 있습니다.
3. target trial을 흉내 내는 척만 한다
가장 흔한 문제 중 하나는 논문 초반에 target trial이라는 말을 쓰지만, 실제 methods를 보면 기존 관찰연구 설계와 크게 다르지 않은 경우입니다. 즉 용어는 modern하지만, time zero나 treatment strategies 정의는 여전히 흐린 상태입니다.
읽을 때 무엇을 봐야 하나
Target trial을 표방하는 논문을 읽을 때는 결과보다 먼저 설계 문장을 봐야 합니다.
- 연구자가 어떤 trial을 상정했는가
- time zero가 어떻게 정의됐는가
- comparator는 진짜 대체 치료인가
- 신규사용자 설계인지
- intention-to-treat와 per-protocol 중 무엇에 가까운지
이 질문에 답이 분명하면, 그다음에 통계기법을 보는 것이 자연스럽습니다. 반대로 이 설계가 흐리면, 모델이 아무리 복잡해도 논문의 핵심은 이미 약해집니다.
왜 이 프레임이 중요한가
TTE가 중요한 이유는 회귀모형을 바꿔주기 때문이 아니라, 연구자의 사고 순서를 바꿔주기 때문입니다.
예전에는 데이터가 있고, 변수가 있고, 분석이 가능하니 연구를 만든다는 순서가 흔했습니다. TTE는 그 순서를 반대로 바꿉니다.
1. 내가 묻고 싶은 임상시험을 먼저 쓴다. 2. 그 trial을 관찰자료에서 어디까지 흉내 낼 수 있는지 본다. 3. 부족한 부분이 무엇인지 투명하게 드러낸다.
이 태도는 연구를 더 겸손하게 만들고, 동시에 더 설득력 있게 만듭니다.
마무리
TTE는 모든 문제를 해결해 주는 마법이 아닙니다. 좋은 comparator를 자동으로 주지도 않고, 측정되지 않은 교란을 사라지게 하지도 않습니다.
하지만 적어도 관찰연구가 무엇을 흉내 내려는지, 어디서부터 한계가 시작되는지를 훨씬 명확하게 보여줍니다. 그래서 저는 TTE를 분석법보다 "질문을 쓰는 훈련"에 더 가깝게 이해합니다.
관찰자료가 풍부할수록, 질문은 더 엄격하게 써야 합니다. Target Trial Emulation은 그 엄격함을 강제하는 좋은 출발점입니다.