우리는 흔히 무작위 배정 임상시험(RCT)을 근거 중심 의학의 '골드 스탠다드(Gold Standard)'라고 부릅니다. 완벽하게 통제된 환경, 엄격한 선정/제외 기준, 그리고 무작위 배정. 이보다 더 과학적인 방법은 없어 보입니다.

하지만 실무를 하다 보면, 그 완벽한 RCT 결과가 '실제 진료 현장(Real-World)'에서는 전혀 다른 양상으로 나타나는 것을 종종 목격합니다.

"임상시험에서는 약효가 좋았는데, 왜 우리 병원 환자들한테는 효과가 덜하지?"

이 질문에 대한 답을 찾기 위해, 오늘은 한 편의 방법론 논문을 빌려 'RCT의 결과를 실제 세상으로 가져오는 방법(Transportability)'에 대해 이야기해 보려 합니다.

1. 효능(Efficacy)과 효과(Effectiveness)의 간극

RCT는 '효능(Efficacy)'을 증명하는 데는 최고입니다. 하지만 '효과(Effectiveness)'를 보장하지는 않습니다.

  • 임상시험 참여자: 젊고, 합병증이 적고, 약을 꼬박꼬박 잘 먹는 '모범 환자'들
  • 실제 환자(Target Population): 고령이고, 당뇨와 고혈압을 달고 살며, 가끔 약 먹는 걸 잊어버리는 '보통 사람들'

임상시험 참여자에서 보인 효능이 실제 환자에서의 효과를 보장할 것인가? 아닙니다.

이 두 집단 간의 간극이 클수록, RCT의 결과는 '그들만의 리그'가 되어버립니다. 그래서 최근 역학에서는 두 가지 개념을 엄격히 구분하기 시작했습니다.

  • 일반화(Generalizability): 연구 샘플이 모집단에서 추출된 경우, 이를 다시 모집단으로 확대 해석하는 것
  • 적용 가능성(Transportability): 연구 샘플과 전혀 다른 특성을 가진 외부 집단(Target Population)에 결과를 적용하는 것

우리가 RWE를 통해 하려는 것은 바로 두 번째, 적용 가능성의 확보입니다.

2. 어떻게 번역할 것인가

복잡한 수식을 빼고, 실무자가 챙겨야 할 핵심 체크리스트만 정리하면 세 가지입니다.

Step 1. 내 환자가 저 환자와 같은가

가장 먼저 effect modifier를 확인해야 합니다. 예를 들어 RCT는 40~60대 백인 남성 위주로 진행됐는데, 내가 적용하려는 대상이 70대 아시아 여성이라면 어떨까요. 나이와 인종이 약효에 영향을 주는 변수라면, RCT 결과는 그대로 적용될 수 없습니다. 분포의 차이가 너무 크다면 번역은 불가능합니다.

Step 2. 데이터는 충분한가

통계적으로 가장 중요한 가정 중 하나가 positivity입니다. 실제 세상에 존재하는 환자 유형이 임상시험에는 한 명도 없다면, 그 환자에 대한 결과는 추정할 수 없습니다.

예를 들어 임상시험에서 신부전 환자를 모두 제외했는데, 리얼월드 데이터로 신부전 환자의 약효를 추정하려 한다면? 이건 통계가 아니라 소설입니다.

Step 3. 분석 방법론은 무엇을 쓸 것인가

단순 비교는 위험합니다. 이때 사용하는 것이 IPSW(Inverse Probability of Sampling Weighting) 같은 기법입니다. 임상시험 환자들에게 가중치를 줘서, 마치 실제 목표 인구의 분포와 비슷하게 모양을 맞춰주는 겁니다. RWE 분석가라면 이 보정 과정을 얼마나 정교하게 설계하느냐가 실력을 판가름합니다.

3. 중요한 건 수학이 아니라 맥락이다

이 논문을 보며 다시 느낀 점은, RWE 연구의 핵심은 화려한 통계 기법 이전에 '임상적 맥락(Clinical Context)'의 이해라는 것입니다.

예를 들어 안정된 단위 처리값 가정 같은 어려운 용어를 현장의 언어로 바꾸면 이런 질문이 됩니다.

"임상시험 때 전문 코디네이터가 매일 전화해서 약 먹었냐고 챙겨주던 그 관리가, 실제 병원에서도 똑같이 제공되고 있는가?"

만약 실제 병원에서는 3분 진료하고 약만 처방한다면, 약효가 다른 건 약의 문제가 아니라 환경의 차이일 수 있습니다. 이걸 보정하지 않고 RWE 연구를 하면 엉뚱한 결론이 나옵니다.

4. 마무리

규제기관은 이제 RCT만 고집하지 않습니다. 오히려 RCT의 한계를 RWE가 어떻게 보완할 수 있는지 묻고 있습니다.

Transportability는 그 질문에 대한 통계학적 대답 중 하나입니다. "데이터는 거짓말을 하지 않지만, 데이터가 나온 환경은 다르다." 이 차이를 메우는 것이 RWE 전문가들이 매일 고민하는 지점이라고 생각합니다.