Estimand는 최근 임상시험과 관찰연구 모두에서 훨씬 더 자주 등장하는 단어가 되었습니다. 겉으로 보면 개념이 복잡해 보이지만, 사실 핵심은 아주 단순합니다.

"우리는 정확히 무엇을 추정하고 있는가?"

이 질문에 답하지 못하면, 같은 데이터와 같은 모델을 가지고도 전혀 다른 해석이 나올 수 있습니다.

왜 estimand가 먼저인가

같은 데이터라도 어떤 환자를 대상으로 하고, 치료 중단을 어떻게 해석하며, 추적기간을 어디까지 볼지에 따라 완전히 다른 효과를 추정하게 됩니다.

예를 들어 "약을 시작한 환자 전체의 1년 내 입원위험"을 보고 싶은 것과, "계속 약을 복용했다고 가정했을 때의 1년 내 입원위험"을 보고 싶은 것은 전혀 다른 질문입니다. 결과 숫자가 비슷하게 나와도, 그 의미는 완전히 다릅니다.

이 차이를 분명히 하지 않으면, 분석은 돌아가도 해석은 흔들리게 됩니다. 그래서 좋은 연구는 모형보다 먼저 estimand를 명시해야 합니다.

구성 요소

Estimand를 생각할 때 최소한 다음 요소들이 필요합니다.

  • 대상 집단
  • 치료전략
  • 비교전략
  • 결과
  • 추적기간
  • intercurrent event 처리 방식

이 여섯 가지가 명확해지면, 연구자는 자신이 무엇을 묻고 있는지 더 선명하게 말할 수 있습니다.

특히 중요한 것은 intercurrent event다

실무에서 가장 많이 흔들리는 부분은 intercurrent event입니다. 약을 중단하거나, switching이 일어나거나, 사망 같은 사건이 중간에 발생하는 순간 연구 질문은 복잡해집니다.

이때 "중단 이후는 무시하고 처음 전략 기준으로 보겠다"와 "중단 시점 이후는 다른 질문으로 보겠다"는 전혀 다른 estimand를 만듭니다.

즉 intercurrent event는 분석의 사소한 기술 문제가 아니라, 질문의 일부입니다.

논문 읽기 포인트

효과 크기보다 먼저 무엇을 추정했다고 주장하는지 봐야 합니다. 같은 hazard ratio라도,

  • 약을 시작한 환자 전체에 대한 ITT에 가까운 estimand인지
  • 계속 복용을 전제로 한 per-protocol estimand인지
  • 실제 치료 변경을 포함한 현실의 as-treated 질문인지

이 구분이 안 되면, 결과를 어디에 적용해야 하는지도 불분명해집니다.

관찰연구에서 estimand가 더 중요한 이유

관찰연구에서는 trial protocol이 사전에 존재하지 않는 경우가 많습니다. 그래서 estimand를 명시하지 않으면 연구의 해석 범위가 더 쉽게 흔들립니다. comparator도, 추적 시작도, 중간 사건 처리도 연구자 선택에 더 많이 의존하기 때문입니다.

바로 이 점 때문에 target trial emulation과 estimand 사고는 서로 잘 맞습니다. trial을 먼저 쓴다는 건, 결국 무엇을 추정하려는지 먼저 고정한다는 뜻이기도 합니다.

마무리

Estimand는 어려운 용어처럼 보이지만, 실은 연구 질문을 더 정직하게 쓰게 만드는 장치입니다.

좋은 연구는 단순히 "효과가 있었다"라고 말하지 않습니다. 누구에게서, 무엇과 비교해, 어떤 기간 동안, 어떤 사건 처리 규칙 아래에서 본 효과인지를 같이 말합니다.

그 문장이 명확해질수록, 분석도 해석도 훨씬 단단해집니다.