FDA의 의료기기 RWE guidance를 처음 펼치면, 많은 사람이 제일 먼저 이런 인상을 받습니다. “결국 real-world data도 잘만 모으면 규제 근거로 쓸 수 있다는 이야기구나.” 물론 크게 틀린 말은 아닙니다. 하지만 이 문서의 핵심은 단순한 낙관론이 아닙니다. 제 눈에는 오히려 그 반대로 보입니다. 이 guidance는 실사용 데이터를 더 쉽게 쓰게 해 주는 문서라기보다, 무엇이 규제 판단을 견딜 만한 데이터와 설계인지 더 집요하게 묻는 문서에 가깝습니다.
그래서 이 문서를 읽을 때는 “FDA가 RWE를 받아준다”는 문장만 기억하면 별 도움이 안 됩니다. 실제로 중요한 건, 언제 받아주고, 무엇을 근거로 받아주며, 어떤 조건이 충족되지 않으면 받아주지 않는가입니다. 저는 이 guidance를 읽을 때 세 층으로 나눠 봅니다. 첫째는 질문의 층이고, 둘째는 데이터의 층이며, 셋째는 설계와 해석의 층입니다.
1. 먼저 봐야 하는 것은 “데이터가 많다”가 아니라 “질문이 맞다”는 점이다
RWE 문서를 읽을 때 흔히 빠지는 함정이 있습니다. 데이터 소스의 규모와 접근성에 먼저 눈이 가는 것입니다. registry가 있는지, claims가 있는지, EHR가 있는지, follow-up이 긴지 같은 문제들 말입니다. 물론 이런 정보는 중요합니다. 그러나 이 guidance가 먼저 묻는 것은 데이터 양이 아니라 규제 질문에 맞는 데이터인지입니다.
예를 들어 어떤 의료기기의 성능을 실제 진료현장에서 평가하고 싶다고 합시다. 여기서 질문은 단순히 “기기를 쓴 환자에서 결과가 어땠는가?”가 아닙니다. FDA 관점에서 더 중요한 질문은 “이 데이터가 비교 가능한 환자군을 만들 수 있는가?”, “임상적으로 중요한 endpoint가 적절하게 정의되는가?”, “device exposure와 outcome timing이 해석 가능한가?”입니다.
즉 이 guidance를 읽을 때 첫 번째 밑줄은 데이터 소스가 아니라 decision context에 그어야 합니다. 이 문서가 허용하는 RWE는 막연한 실사용 데이터가 아니라, 구체적인 규제 질문을 견딜 수 있는 실사용 데이터입니다.
2. 두 번째는 데이터 source 그 자체보다 data relevance와 reliability를 보는 것이다
이 guidance에서 반복해서 등장하는 단어는 결국 relevance와 reliability입니다. 저는 이걸 아주 단순하게 번역합니다.
- relevance: 이 데이터가 지금 묻는 질문에 맞는가
- reliability: 이 데이터가 믿을 만한 방식으로 생성되고 관리되었는가
이 두 단어는 말로만 보면 당연해 보입니다. 하지만 실무에서는 전혀 당연하지 않습니다. 예를 들어 registry 데이터가 있다고 해도, 기기 사용 시점이 애매하고, outcome이 병원마다 다른 방식으로 기록되며, loss to follow-up이 심하면 reliability는 바로 흔들립니다. 반대로 아주 깔끔한 구조화 데이터가 있어도 실제로 중요한 임상 질문을 담지 못하면 relevance가 떨어집니다.
이 guidance를 읽을 때 저는 “이 데이터셋을 쓸 수 있는가?”보다 “이 데이터셋이 어떤 질문까지는 버틸 수 있고, 어디서부터는 무너지는가?”를 먼저 봐야 한다고 생각합니다. 이 태도가 없으면 문서가 너무 낙관적으로 읽힙니다.
3. 의료기기 RWE는 약물 RWE보다 device lifecycle과 usage context를 더 강하게 의식한다
이 문서를 흥미롭게 만드는 지점은, 약물 RWE 문서와 닮아 있으면서도 다르게 읽혀야 한다는 점입니다. 의료기기는 기기 자체의 성능만이 아니라 사용자, 시술자, 병원 환경, learning curve, software revision 같은 요소의 영향을 강하게 받습니다.
그래서 같은 기기라도 도입 초기와 숙련 후의 결과가 다를 수 있고, 같은 회사 제품이라도 버전이 바뀌면 해석이 달라질 수 있습니다. 또한 시술자의 숙련도나 센터 volume 같은 요소가 outcome에 영향을 주기 쉽습니다. 이건 약물보다 훨씬 더 “환경과 사용 맥락”에 민감한 구조입니다.
이 guidance를 읽을 때 중요한 건 FDA가 RWE를 의료기기 영역에서 단순히 확장하고 있다는 사실이 아니라, 기기의 성격상 현실 맥락을 더 세밀하게 봐야 한다는 사실을 전제로 하고 있다는 점입니다.
4. 결국 읽어야 하는 핵심은 bias list가 아니라 bias structure다
규제 guidance를 읽을 때 흔히 목록형으로 읽게 됩니다. selection bias, information bias, missing data, confounding. 물론 이런 체크리스트는 중요합니다. 하지만 실제 설계를 바꾸는 건 항목을 외우는 것이 아니라 이 연구에서 bias가 어떤 구조로 생기는지 이해하는 것입니다.
예를 들어 device registry에서 comparator arm이 자연스럽게 형성되지 않는다면, 그건 단순한 confounding 문제를 넘어 clinical pathway 자체가 비교를 어렵게 만드는 구조일 수 있습니다. 또 post-market setting에서 특정 adverse event가 보고될 확률이 센터마다 다르면, outcome ascertainment는 단순한 데이터 품질 문제가 아니라 surveillance intensity 차이의 문제일 수 있습니다.
그래서 저는 이 guidance를 읽을 때 “bias를 줄여라”라는 문장보다 “이 문맥에서 bias가 어디서 태어나는가”를 더 중요하게 봅니다. 이 차이가 문서를 읽고도 아무 설계 변화가 없는 사람과, 실제 protocol이 달라지는 사람을 가릅니다.
5. 이 guidance가 실무자에게 던지는 진짜 질문
실무적으로는 이 문서를 읽고 나서 아래 질문에 답할 수 있어야 합니다.
1. 내가 쓰려는 데이터는 규제 질문과 정말 맞는가? 2. comparator는 자연스럽게 형성되는가, 아니면 설계로 보강해야 하는가? 3. 기기 사용 시점, 버전, operator effect, 센터 effect를 충분히 설명할 수 있는가? 4. endpoint와 follow-up이 규제 판단을 버틸 정도로 안정적으로 정의되는가? 5. 이 연구가 보여주는 것은 efficacy에 가까운가, effectiveness에 가까운가, 아니면 surveillance signal에 가까운가?
이 다섯 질문에 답하지 못하면, guidance를 읽었다고 해도 실제 제출 전략은 크게 달라지지 않습니다.
6. 그래서 이 문서는 “허용 문서”가 아니라 “정교화 문서”다
결국 제가 이 guidance를 읽고 남긴 한 줄 평은 이렇습니다.
FDA의 의료기기 RWE guidance는 RWE를 더 쉽게 허용하는 문서라기보다, 규제 질문에 맞는 데이터와 설계를 더 정교하게 만들라고 요구하는 문서다.
이 차이는 큽니다. 전자의 태도로 읽으면 “이제 registry도 되고 EHR도 되겠구나” 정도로 끝납니다. 후자의 태도로 읽으면 “지금 내가 가진 데이터와 protocol에서 어떤 부분이 규제 검토를 버티지 못할까?”라는 질문으로 이어집니다.
저는 규제 문서를 읽을 때 늘 “무엇을 허용하는가?”보다 “무엇을 요구하는가?”를 먼저 봅니다. 이 guidance도 마찬가지입니다. 그리고 그 요구를 제대로 읽어내는 순간, RWE는 데이터 접근성의 문제가 아니라 설계 품질의 문제가 됩니다.
참고 링크
[FDA guidance page](https://www.fda.gov/regulatory-information/search-fda-guidance-documents/use-real-world-evidence-support-regulatory-decision-making-medical-devices)