의료 분야에서 빅 데이터 분석의 10대 과제
페이지 정보
작성자 빅데이터정보1 작성일 24-06-27 15:48 조회 17회 댓글 0건본문
의료 분야에서 빅 데이터 분석의 10대 과제
의료 분야의 빅 데이터 분석에는 보안, 시각화 및 여러 가지 데이터 무결성 문제를 포함한 많은 과제가 수반됩니다.
빅 데이터 분석은 의료 산업의 주요 사업입니다.
전자 건강 기록(EHR)에 데이터를 넣는 일에 거의 손을 대지 못한 공급자들은 이제 EHR에서 실행 가능한 통찰력을 끌어내고, 이러한 학습 내용을 상환에 직접적인 영향을 미치는 복잡한 이니셔티브에 적용해야 합니다.
데이터 기반 인사이트를 임상 및 운영 프로세스에 성공적으로 통합하는 의료 조직의 경우, 보상이 클 수 있습니다. 데이터 자산을 데이터 인사이트로 전환하면 건강한 환자, 낮은 치료 비용, 성능에 대한 더 많은 가시성, 높은 직원 및 소비자 만족률 등이 많은 이점 중 하나입니다.
그러나 의미 있는 의료 분석으로 가는 길은 도전과 해결해야 할 문제로 가득 찬 험난한 길입니다.
빅 데이터는 복잡하고 다루기 힘들기 때문에 의료 조직은 데이터를 수집, 저장, 분석하고 직원, 비즈니스 파트너 및 환자에게 제공하는 접근 방식을 면밀히 검토해야 합니다.
자세히 알아보기: 의료 데이터 사이클: 생성, 수집 및 처리
기업이 빅 데이터 분석 프로그램을 부팅할 때 일반적으로 직면하는 가장 큰 과제는 무엇이며, 데이터 기반 임상 및 재무 목표를 달성하기 위해 이러한 문제를 극복하는 방법은 무엇입니까?
1. 캡처
모든 데이터는 어디에서 온 것입니다. 안타깝게도, 많은 의료 공급자들에게 완벽한 데이터 거버넌스 습관이 있는 곳에서 온 것은 아닙니다. 여러 시스템에서 사용할 수 있도록 깨끗하고, 완전하고, 정확하며, 올바른 형식을 갖춘 데이터를 캡처하는 것은 조직의 지속적인 싸움이며, 이들 중 다수는 분쟁에서 승리하는 편이 아닙니다.
강력한 데이터 수집 프로세스를 갖는 것은 EHR, 인공지능(AI), 머신러닝(ML) 시대에 의료 분야에서 빅데이터 분석 노력을 진전시키는 데 핵심입니다. 적절한 데이터 캡처는 조직이 임상 치료를 개선하기 위해 데이터 세트를 구축하고 프로젝트를 지원하기 위해 취할 수 있는 첫 번째 단계 중 하나입니다.
열악한 EHR 사용성, 복잡한 워크플로우, 빅데이터를 캡처하는 데 중요한 이유에 대한 불완전한 이해 등은 데이터의 라이프사이클 전반에 걸쳐 데이터를 괴롭히고 사용성을 제한하는 품질 문제를 야기할 수 있습니다.
공급자는 특정 프로젝트에 대해 가치 있는 데이터 유형(EHR, 게놈 데이터, 인구 수준 정보)의 우선순위를 정하고, 건강 정보 관리 전문가의 데이터 거버넌스 및 무결성 전문 지식을 확보하며, 다운스트림 분석에 유용한 데이터를 관리하는 임상 문서 개선 프로그램을 개발함으로써 데이터 캡처 루틴을 개선하기 시작할 수 있습니다.
2. 클리닝
자세히 보기: 상태 데이터 라이프사이클의 스토리지, 관리 및 분석
의료 서비스 제공자는 진료실과 수술실에서 청결의 중요성에 대해 친밀하게 알고 있지만 데이터를 청결하게 유지하는 것이 얼마나 중요한지에 대해서는 잘 알지 못할 수도 있습니다.
더러운 데이터는 특히 임상 또는 운영 요소를 약간 다른 형식으로 기록할 수 있는 서로 다른 데이터 소스를 통합할 때 빅 데이터 분석 프로젝트를 빠르게 방해할 수 있습니다. 데이터 클리닝(클렌징 또는 스크러빙)은 데이터 세트가 정확하고 정확하며 일관성 있고 관련성이 있으며 손상되지 않도록 보장합니다.
국가보건정보기술조정관실(ONC)은 데이터 클리닝 프로세스를 가능한 한 최초 캡처 시점에 가깝게 수행할 것을 권장합니다. 이는 잠재적인 중복 작업이나 상충되는 클리닝 활동을 최소화하기 위한 것입니다.
일부 데이터 클리닝 프로세스는 여전히 수동으로 수행되지만, 자동화된 데이터 클리닝 도구와 프레임워크는 의료 이해 관계자의 데이터 무결성 노력을 지원하기 위해 사용할 수 있습니다. 이러한 도구는 AI 및 ML 기술이 빠르게 발전함에 따라 점점 더 정교해지고 정밀해져 의료 데이터 웨어하우스에서 높은 수준의 정확성과 무결성을 보장하는 데 필요한 시간과 비용을 절감할 수 있습니다.
3. 스토리지
데이터 스토리지는 의료 정보 기술(IT) 부서의 중요한 비용, 보안 및 성능 문제입니다. 의료 데이터의 양이 기하급수적으로 증가함에 따라 일부 공급업체는 더 이상 사내 데이터 센터의 비용과 영향을 관리할 수 없습니다.
자세한 내용: 의료 분석 데이터 시각화, 해석 및 폐기
온프레미스 데이터 스토리지는 보안, 액세스 및 가동 시간에 대한 제어를 약속하지만 온사이트 서버 네트워크는 확장 비용이 많이 들고 유지 관리가 어렵고 여러 부서에 걸쳐 데이터 사일로를 생성하기 쉽습니다.
클라우드 스토리지 및 기타 디지털 헬스 생태계는 비용이 감소하고 신뢰성이 증가함에 따라 공급자와 지불자에게 점점 더 매력적이 되고 있습니다.
클라우드는 신속한 재해 복구, 사전 비용 절감, 간편한 확장 기능을 제공합니다. 그러나 조직은 1996년 HIPAA(Health Insurance Portability and Accountability Act of 1996) 인증 클라우드 스토리지 파트너를 선택하는 데 매우 신중해야 합니다.
많은 조직에서 데이터 스토리지 프로그램에 대한 하이브리드 접근 방식을 선택하게 되는데, 이는 다양한 데이터 액세스 및 스토리지 요구 사항을 가진 공급자에게 가장 유연하고 효과적인 접근 방식일 수 있습니다. 그러나 하이브리드 인프라를 개발할 때 공급자는 서로 다른 시스템이 필요할 때 조직의 다른 부문과 데이터를 통신하고 공유할 수 있도록 주의해야 합니다.
4. 보안
데이터 보안은 특히 세간의 이목을 끄는 일련의 침해, 해킹 및 랜섬웨어 에피소드의 신속한 발생 이후 의료 기관의 주요 우선 순위입니다. 제로데이 공격부터 AI 지원 사이버 공격에 이르기까지 의료 데이터는 거의 무한히 많은 취약성을 가지고 있습니다.
HIPAA 보안 규칙에는 전송 보안, 인증 프로토콜 및 액세스, 무결성 및 감사에 대한 제어를 포함하여 보호된 건강 정보(PHI)를 저장하는 조직을 위한 기술적 안전 장치가 많이 포함되어 있습니다.
실제로 이러한 보호 조치는 최신 안티바이러스 소프트웨어 사용, 민감한 데이터 암호화 및 다중 요소 인증 사용과 같은 상식적인 보안 절차로 이어집니다.
하지만 가장 엄격하게 보안된 데이터 센터조차도 사이버 보안 관행에 정통하지 않을 수 있는 인력 구성원의 오류로 인해 중단될 수 있습니다.
의료 조직은 전사적으로 데이터 보안 프로토콜의 중요한 특성을 수시로 전달하고, 직원 사이버 보안 교육 및 의료 관련 사이버 보안 성능 목표를 우선시하며, 누가 고액 데이터 자산에 액세스할 수 있는지 지속적으로 검토하여 악의적인 당사자가 피해를 입히지 않도록 해야 합니다.
5. 스튜어드십
의료 데이터는 특히 임상 측면에서 유통기한이 길습니다. HIPAA가 요구하는 대로 환자 데이터에 접근할 수 있도록 최소 6년 이상 유지할 뿐만 아니라, 공급자는 식별되지 않은 데이터 세트를 연구 프로젝트에 활용하고자 할 수 있으며, 이는 지속적인 관리 및 큐레이션을 중요한 관심사로 만듭니다. 데이터는 품질 측정 또는 성능 벤치마킹과 같은 다른 목적으로 재사용되거나 재검토될 수도 있습니다.
데이터가 언제, 누구에 의해, 어떤 목적으로 생성되었는지, 과거에 데이터가 어떻게 사용되었는지를 이해하는 것은 연구자와 데이터 분석가에게 중요합니다.
성공적인 데이터 거버넌스 계획의 핵심 요소는 완전하고 정확하며 업데이트된 메타데이터를 개발하는 것입니다. 메타데이터를 사용하면 분석가가 이전 쿼리를 정확하게 복제할 수 있으며, 이는 과학적 연구와 정확한 벤치마킹에 필수적이며, 제한된 유용성으로 "데이터 덤프스터" 또는 분리된 데이터 세트를 만드는 것을 방지할 수 있습니다.
의료 기관은 의미 있는 메타데이터의 개발과 큐레이션을 담당할 데이터 관리자를 지정해야 합니다. 데이터 관리자는 모든 요소가 표준 정의와 형식을 갖추고 있고, 생성부터 삭제까지 적절하게 문서화되어 있으며, 당면한 작업에 유용하게 사용될 수 있도록 보장할 수 있습니다.
6. 조회 중
또한 강력한 메타데이터와 강력한 스튜어드십 프로토콜을 사용하면 조직이 데이터를 조회하고 원하는 답변을 쉽게 얻을 수 있습니다. 보고 및 분석을 위해서는 데이터를 조회하는 기능이 기본이지만 의료 기관은 일반적으로 빅데이터 자산에 대한 의미 있는 분석에 참여하기 전에 여러 과제를 극복해야 합니다.
첫째, 질의 도구가 조직의 전체 정보 저장소에 접근할 수 없도록 하는 데이터 사일로 및 상호 운용성 문제를 극복해야 합니다. 데이터 세트의 서로 다른 구성 요소가 여러 개의 벽으로 둘러싸인 시스템에 있거나 서로 다른 형식으로 존재하는 경우 조직의 상태 또는 환자 개개인의 상태에 대한 완전한 초상화를 생성하지 못할 수 있습니다.
데이터가 공통 창고에 살아도 표준화와 품질이 부족할 수 있습니다.
자유 형식 개념을 공유 온톨로지로 축소하는 ICD(International Classification of Diseases), SNOMED-CT(SNOMED-CT) 또는 LOINC(Logical Observation Identifier Names and Codes)와 같은 의료 코딩 시스템이 없는 경우 쿼리가 올바른 정보를 식별하고 사용자에게 반환하는지 확인하기 어려울 수 있습니다.
많은 조직에서 SQL(Structured Query Language)을 사용하여 대규모 데이터 세트와 관계형 데이터베이스로 뛰어들고 있지만 사용자가 당면한 데이터의 정확성, 완전성 및 표준화를 먼저 신뢰할 수 있을 때만 효과적입니다.
7. 보고
공급자가 쿼리 프로세스를 확정한 후에는 대상 오디언스가 명확하고 간결하며 액세스할 수 있는 보고서를 생성해야 합니다.
다시 한 번 말하지만, 데이터의 정확성과 무결성은 보고서의 정확성과 신뢰성에 결정적인 다운스트림 영향을 미칩니다. 처음에 데이터가 부실하면 프로세스가 끝날 때 의심스러운 보고서가 생성되고, 이는 환자를 치료하는 데 정보를 사용하려는 임상의에게 해로울 수 있습니다.
공급자는 "분석"과 "보고"의 차이도 이해해야 합니다. 보고는 종종 분석의 전제 조건입니다 – 데이터를 검사하기 전에 추출해야 합니다 – 보고는 최종 산출물로서도 자립할 수 있습니다.
일부 보고서는 특정 경향을 강조하거나 새로운 결론에 도달하거나 독자에게 특정 행동을 취하도록 설득하는 데 초점을 맞출 수 있지만, 다른 보고서는 데이터의 전체 스펙트럼이 무엇을 의미하는지에 대해 독자가 스스로 추론할 수 있는 방식으로 제시되어야 합니다.
조직은 데이터베이스 관리자가 실제로 필요한 정보를 생성할 수 있도록 보고서를 어떻게 사용할 것인지에 대해 매우 명확해야 합니다.
규제 및 품질 평가 프로그램은 품질 측정 및 보상 모델을 제공하기 위해 많은 양의 데이터를 요구하는 경우가 많기 때문에 의료 업계에서 보고되는 내용의 상당 부분은 외부적입니다. 공급자는 자격을 갖춘 등록부, 전자 건강 기록에 내장된 보고 도구, 메디케어 & 메디케이드 서비스 센터(CMS) 및 기타 그룹이 주최하는 웹 포털 등 다양한 요구 사항을 충족하기 위한 다양한 옵션을 가지고 있습니다.
8. 시각화
진료의 관점에서 깨끗하고 매력적인 데이터 시각화는 임상의가 정보를 흡수하고 적절하게 사용하는 것을 훨씬 쉽게 만들 수 있습니다.
컬러 코딩은 일반적으로 즉각적인 반응을 생성하는 일반적인 데이터 시각화 기술입니다. 예를 들어, 빨간색, 노란색 및 녹색은 일반적으로 정지, 주의 및 이동을 의미하는 것으로 이해됩니다.
또한 적절한 비율을 사용하여 대조적인 수치를 설명하는 차트와 잠재적인 혼란을 줄이기 위한 올바른 정보 라벨링을 활용하는 등의 데이터 프레젠테이션 모범 사례도 고려해야 합니다. 복잡한 흐름도, 비좁거나 중복되는 텍스트, 저품질 그래픽은 받는 사람을 좌절시키고 짜증나게 하여 데이터를 무시하거나 잘못 해석하게 할 수 있습니다.
일반적인 의료 데이터 시각화 접근 방식에는 피벗 테이블, 차트 및 대시보드가 포함되며, 이들은 모두 개념과 정보를 설명하기 위한 고유한 용도를 가지고 있습니다.
9. 업데이트중
의료 데이터는 동적이며, 대부분의 요소는 최신 상태와 관련성을 유지하기 위해 비교적 자주 업데이트해야 합니다. 환자의 활력 징후와 같은 일부 데이터 세트의 경우 이러한 업데이트가 몇 초마다 발생할 수 있습니다. 집 주소나 결혼 상태와 같은 다른 정보는 개인이 평생 동안 몇 번만 바뀔 수도 있습니다.
빅 데이터의 변동성, 즉 데이터 자산을 지속적으로 모니터링하지 않는 조직에서는 빅 데이터의 변동성을 파악하는 것이 과제가 될 수 있습니다.
공급자는 수동 업데이트가 필요한 데이터 세트, 자동화할 수 있는 데이터 세트, 최종 사용자의 다운타임 없이 이 프로세스를 완료하는 방법, 데이터 세트의 품질이나 무결성을 손상시키지 않고 업데이트를 수행할 수 있는 방법에 대해 명확한 아이디어를 가지고 있어야 합니다.
또한 조직은 단일 요소에 대한 업데이트를 시도할 때 불필요한 중복 기록을 만들지 않도록 해야 하며, 이로 인해 임상의가 환자 의사 결정에 필요한 정보에 액세스하는 것이 어려울 수 있습니다.
10. 공유
공급자는 진공 상태에서 운영되지 않으며, 한 곳에서 모든 치료를 받는 환자는 거의 없습니다. 이는 특히 산업이 인구 건강 관리 및 가치 기반 의료로 이동하는 과정에서 외부 파트너와 데이터를 공유하는 것이 필수적임을 의미합니다.
데이터 상호 운용성은 데이터 성숙도 스펙트럼에 따라 모든 유형, 크기 및 위치에 대한 조직의 지속적인 관심사입니다.
의료 정보 시스템 설계 및 구현의 근본적인 차이는 사용자가 서로 다른 조직 간에 데이터를 이동할 수 있는 능력을 심각하게 저하시킬 수 있으며, 임상의가 주요 의사 결정을 내리고 환자를 추적하며 전반적인 결과를 개선하는 전략을 개발하는 데 필요한 정보를 제공하지 못하는 경우가 많습니다.
업계는 현재 기술적 장벽과 조직적 장벽을 넘어 데이터 공유를 개선하기 위해 열심히 노력하고 있습니다. FHIR(Fast Healthcare Interoperability Resource) 및 API(Application Programming Interface)와 같은 새로운 도구와 전략으로 인해 조직이 쉽고 안전하게 데이터를 공유할 수 있게 되었습니다.
그러나 이러한 방법론의 채택은 다양하여 많은 조직이 환자 데이터의 원활한 공유에 내재된 가능성과 단절되어 있습니다.
의료 연속체의 모든 구성원을 신뢰할 수 있고 시의적절하며 의미 있는 정보로 연결하는 빅 데이터 교환 생태계를 구축하기 위해 공급자는 이 목록에 있는 모든 도전 과제를 극복해야 합니다. 그렇게 하려면 시간, 헌신, 자금 및 커뮤니케이션이 필요하지만 성공은 이러한 모든 우려의 부담을 덜어줄 것입니다.
의료 분야의 빅 데이터 분석에는 보안, 시각화 및 여러 가지 데이터 무결성 문제를 포함한 많은 과제가 수반됩니다.
빅 데이터 분석은 의료 산업의 주요 사업입니다.
전자 건강 기록(EHR)에 데이터를 넣는 일에 거의 손을 대지 못한 공급자들은 이제 EHR에서 실행 가능한 통찰력을 끌어내고, 이러한 학습 내용을 상환에 직접적인 영향을 미치는 복잡한 이니셔티브에 적용해야 합니다.
데이터 기반 인사이트를 임상 및 운영 프로세스에 성공적으로 통합하는 의료 조직의 경우, 보상이 클 수 있습니다. 데이터 자산을 데이터 인사이트로 전환하면 건강한 환자, 낮은 치료 비용, 성능에 대한 더 많은 가시성, 높은 직원 및 소비자 만족률 등이 많은 이점 중 하나입니다.
그러나 의미 있는 의료 분석으로 가는 길은 도전과 해결해야 할 문제로 가득 찬 험난한 길입니다.
빅 데이터는 복잡하고 다루기 힘들기 때문에 의료 조직은 데이터를 수집, 저장, 분석하고 직원, 비즈니스 파트너 및 환자에게 제공하는 접근 방식을 면밀히 검토해야 합니다.
자세히 알아보기: 의료 데이터 사이클: 생성, 수집 및 처리
기업이 빅 데이터 분석 프로그램을 부팅할 때 일반적으로 직면하는 가장 큰 과제는 무엇이며, 데이터 기반 임상 및 재무 목표를 달성하기 위해 이러한 문제를 극복하는 방법은 무엇입니까?
1. 캡처
모든 데이터는 어디에서 온 것입니다. 안타깝게도, 많은 의료 공급자들에게 완벽한 데이터 거버넌스 습관이 있는 곳에서 온 것은 아닙니다. 여러 시스템에서 사용할 수 있도록 깨끗하고, 완전하고, 정확하며, 올바른 형식을 갖춘 데이터를 캡처하는 것은 조직의 지속적인 싸움이며, 이들 중 다수는 분쟁에서 승리하는 편이 아닙니다.
강력한 데이터 수집 프로세스를 갖는 것은 EHR, 인공지능(AI), 머신러닝(ML) 시대에 의료 분야에서 빅데이터 분석 노력을 진전시키는 데 핵심입니다. 적절한 데이터 캡처는 조직이 임상 치료를 개선하기 위해 데이터 세트를 구축하고 프로젝트를 지원하기 위해 취할 수 있는 첫 번째 단계 중 하나입니다.
열악한 EHR 사용성, 복잡한 워크플로우, 빅데이터를 캡처하는 데 중요한 이유에 대한 불완전한 이해 등은 데이터의 라이프사이클 전반에 걸쳐 데이터를 괴롭히고 사용성을 제한하는 품질 문제를 야기할 수 있습니다.
공급자는 특정 프로젝트에 대해 가치 있는 데이터 유형(EHR, 게놈 데이터, 인구 수준 정보)의 우선순위를 정하고, 건강 정보 관리 전문가의 데이터 거버넌스 및 무결성 전문 지식을 확보하며, 다운스트림 분석에 유용한 데이터를 관리하는 임상 문서 개선 프로그램을 개발함으로써 데이터 캡처 루틴을 개선하기 시작할 수 있습니다.
2. 클리닝
자세히 보기: 상태 데이터 라이프사이클의 스토리지, 관리 및 분석
의료 서비스 제공자는 진료실과 수술실에서 청결의 중요성에 대해 친밀하게 알고 있지만 데이터를 청결하게 유지하는 것이 얼마나 중요한지에 대해서는 잘 알지 못할 수도 있습니다.
더러운 데이터는 특히 임상 또는 운영 요소를 약간 다른 형식으로 기록할 수 있는 서로 다른 데이터 소스를 통합할 때 빅 데이터 분석 프로젝트를 빠르게 방해할 수 있습니다. 데이터 클리닝(클렌징 또는 스크러빙)은 데이터 세트가 정확하고 정확하며 일관성 있고 관련성이 있으며 손상되지 않도록 보장합니다.
국가보건정보기술조정관실(ONC)은 데이터 클리닝 프로세스를 가능한 한 최초 캡처 시점에 가깝게 수행할 것을 권장합니다. 이는 잠재적인 중복 작업이나 상충되는 클리닝 활동을 최소화하기 위한 것입니다.
일부 데이터 클리닝 프로세스는 여전히 수동으로 수행되지만, 자동화된 데이터 클리닝 도구와 프레임워크는 의료 이해 관계자의 데이터 무결성 노력을 지원하기 위해 사용할 수 있습니다. 이러한 도구는 AI 및 ML 기술이 빠르게 발전함에 따라 점점 더 정교해지고 정밀해져 의료 데이터 웨어하우스에서 높은 수준의 정확성과 무결성을 보장하는 데 필요한 시간과 비용을 절감할 수 있습니다.
3. 스토리지
데이터 스토리지는 의료 정보 기술(IT) 부서의 중요한 비용, 보안 및 성능 문제입니다. 의료 데이터의 양이 기하급수적으로 증가함에 따라 일부 공급업체는 더 이상 사내 데이터 센터의 비용과 영향을 관리할 수 없습니다.
자세한 내용: 의료 분석 데이터 시각화, 해석 및 폐기
온프레미스 데이터 스토리지는 보안, 액세스 및 가동 시간에 대한 제어를 약속하지만 온사이트 서버 네트워크는 확장 비용이 많이 들고 유지 관리가 어렵고 여러 부서에 걸쳐 데이터 사일로를 생성하기 쉽습니다.
클라우드 스토리지 및 기타 디지털 헬스 생태계는 비용이 감소하고 신뢰성이 증가함에 따라 공급자와 지불자에게 점점 더 매력적이 되고 있습니다.
클라우드는 신속한 재해 복구, 사전 비용 절감, 간편한 확장 기능을 제공합니다. 그러나 조직은 1996년 HIPAA(Health Insurance Portability and Accountability Act of 1996) 인증 클라우드 스토리지 파트너를 선택하는 데 매우 신중해야 합니다.
많은 조직에서 데이터 스토리지 프로그램에 대한 하이브리드 접근 방식을 선택하게 되는데, 이는 다양한 데이터 액세스 및 스토리지 요구 사항을 가진 공급자에게 가장 유연하고 효과적인 접근 방식일 수 있습니다. 그러나 하이브리드 인프라를 개발할 때 공급자는 서로 다른 시스템이 필요할 때 조직의 다른 부문과 데이터를 통신하고 공유할 수 있도록 주의해야 합니다.
4. 보안
데이터 보안은 특히 세간의 이목을 끄는 일련의 침해, 해킹 및 랜섬웨어 에피소드의 신속한 발생 이후 의료 기관의 주요 우선 순위입니다. 제로데이 공격부터 AI 지원 사이버 공격에 이르기까지 의료 데이터는 거의 무한히 많은 취약성을 가지고 있습니다.
HIPAA 보안 규칙에는 전송 보안, 인증 프로토콜 및 액세스, 무결성 및 감사에 대한 제어를 포함하여 보호된 건강 정보(PHI)를 저장하는 조직을 위한 기술적 안전 장치가 많이 포함되어 있습니다.
실제로 이러한 보호 조치는 최신 안티바이러스 소프트웨어 사용, 민감한 데이터 암호화 및 다중 요소 인증 사용과 같은 상식적인 보안 절차로 이어집니다.
하지만 가장 엄격하게 보안된 데이터 센터조차도 사이버 보안 관행에 정통하지 않을 수 있는 인력 구성원의 오류로 인해 중단될 수 있습니다.
의료 조직은 전사적으로 데이터 보안 프로토콜의 중요한 특성을 수시로 전달하고, 직원 사이버 보안 교육 및 의료 관련 사이버 보안 성능 목표를 우선시하며, 누가 고액 데이터 자산에 액세스할 수 있는지 지속적으로 검토하여 악의적인 당사자가 피해를 입히지 않도록 해야 합니다.
5. 스튜어드십
의료 데이터는 특히 임상 측면에서 유통기한이 길습니다. HIPAA가 요구하는 대로 환자 데이터에 접근할 수 있도록 최소 6년 이상 유지할 뿐만 아니라, 공급자는 식별되지 않은 데이터 세트를 연구 프로젝트에 활용하고자 할 수 있으며, 이는 지속적인 관리 및 큐레이션을 중요한 관심사로 만듭니다. 데이터는 품질 측정 또는 성능 벤치마킹과 같은 다른 목적으로 재사용되거나 재검토될 수도 있습니다.
데이터가 언제, 누구에 의해, 어떤 목적으로 생성되었는지, 과거에 데이터가 어떻게 사용되었는지를 이해하는 것은 연구자와 데이터 분석가에게 중요합니다.
성공적인 데이터 거버넌스 계획의 핵심 요소는 완전하고 정확하며 업데이트된 메타데이터를 개발하는 것입니다. 메타데이터를 사용하면 분석가가 이전 쿼리를 정확하게 복제할 수 있으며, 이는 과학적 연구와 정확한 벤치마킹에 필수적이며, 제한된 유용성으로 "데이터 덤프스터" 또는 분리된 데이터 세트를 만드는 것을 방지할 수 있습니다.
의료 기관은 의미 있는 메타데이터의 개발과 큐레이션을 담당할 데이터 관리자를 지정해야 합니다. 데이터 관리자는 모든 요소가 표준 정의와 형식을 갖추고 있고, 생성부터 삭제까지 적절하게 문서화되어 있으며, 당면한 작업에 유용하게 사용될 수 있도록 보장할 수 있습니다.
6. 조회 중
또한 강력한 메타데이터와 강력한 스튜어드십 프로토콜을 사용하면 조직이 데이터를 조회하고 원하는 답변을 쉽게 얻을 수 있습니다. 보고 및 분석을 위해서는 데이터를 조회하는 기능이 기본이지만 의료 기관은 일반적으로 빅데이터 자산에 대한 의미 있는 분석에 참여하기 전에 여러 과제를 극복해야 합니다.
첫째, 질의 도구가 조직의 전체 정보 저장소에 접근할 수 없도록 하는 데이터 사일로 및 상호 운용성 문제를 극복해야 합니다. 데이터 세트의 서로 다른 구성 요소가 여러 개의 벽으로 둘러싸인 시스템에 있거나 서로 다른 형식으로 존재하는 경우 조직의 상태 또는 환자 개개인의 상태에 대한 완전한 초상화를 생성하지 못할 수 있습니다.
데이터가 공통 창고에 살아도 표준화와 품질이 부족할 수 있습니다.
자유 형식 개념을 공유 온톨로지로 축소하는 ICD(International Classification of Diseases), SNOMED-CT(SNOMED-CT) 또는 LOINC(Logical Observation Identifier Names and Codes)와 같은 의료 코딩 시스템이 없는 경우 쿼리가 올바른 정보를 식별하고 사용자에게 반환하는지 확인하기 어려울 수 있습니다.
많은 조직에서 SQL(Structured Query Language)을 사용하여 대규모 데이터 세트와 관계형 데이터베이스로 뛰어들고 있지만 사용자가 당면한 데이터의 정확성, 완전성 및 표준화를 먼저 신뢰할 수 있을 때만 효과적입니다.
7. 보고
공급자가 쿼리 프로세스를 확정한 후에는 대상 오디언스가 명확하고 간결하며 액세스할 수 있는 보고서를 생성해야 합니다.
다시 한 번 말하지만, 데이터의 정확성과 무결성은 보고서의 정확성과 신뢰성에 결정적인 다운스트림 영향을 미칩니다. 처음에 데이터가 부실하면 프로세스가 끝날 때 의심스러운 보고서가 생성되고, 이는 환자를 치료하는 데 정보를 사용하려는 임상의에게 해로울 수 있습니다.
공급자는 "분석"과 "보고"의 차이도 이해해야 합니다. 보고는 종종 분석의 전제 조건입니다 – 데이터를 검사하기 전에 추출해야 합니다 – 보고는 최종 산출물로서도 자립할 수 있습니다.
일부 보고서는 특정 경향을 강조하거나 새로운 결론에 도달하거나 독자에게 특정 행동을 취하도록 설득하는 데 초점을 맞출 수 있지만, 다른 보고서는 데이터의 전체 스펙트럼이 무엇을 의미하는지에 대해 독자가 스스로 추론할 수 있는 방식으로 제시되어야 합니다.
조직은 데이터베이스 관리자가 실제로 필요한 정보를 생성할 수 있도록 보고서를 어떻게 사용할 것인지에 대해 매우 명확해야 합니다.
규제 및 품질 평가 프로그램은 품질 측정 및 보상 모델을 제공하기 위해 많은 양의 데이터를 요구하는 경우가 많기 때문에 의료 업계에서 보고되는 내용의 상당 부분은 외부적입니다. 공급자는 자격을 갖춘 등록부, 전자 건강 기록에 내장된 보고 도구, 메디케어 & 메디케이드 서비스 센터(CMS) 및 기타 그룹이 주최하는 웹 포털 등 다양한 요구 사항을 충족하기 위한 다양한 옵션을 가지고 있습니다.
8. 시각화
진료의 관점에서 깨끗하고 매력적인 데이터 시각화는 임상의가 정보를 흡수하고 적절하게 사용하는 것을 훨씬 쉽게 만들 수 있습니다.
컬러 코딩은 일반적으로 즉각적인 반응을 생성하는 일반적인 데이터 시각화 기술입니다. 예를 들어, 빨간색, 노란색 및 녹색은 일반적으로 정지, 주의 및 이동을 의미하는 것으로 이해됩니다.
또한 적절한 비율을 사용하여 대조적인 수치를 설명하는 차트와 잠재적인 혼란을 줄이기 위한 올바른 정보 라벨링을 활용하는 등의 데이터 프레젠테이션 모범 사례도 고려해야 합니다. 복잡한 흐름도, 비좁거나 중복되는 텍스트, 저품질 그래픽은 받는 사람을 좌절시키고 짜증나게 하여 데이터를 무시하거나 잘못 해석하게 할 수 있습니다.
일반적인 의료 데이터 시각화 접근 방식에는 피벗 테이블, 차트 및 대시보드가 포함되며, 이들은 모두 개념과 정보를 설명하기 위한 고유한 용도를 가지고 있습니다.
9. 업데이트중
의료 데이터는 동적이며, 대부분의 요소는 최신 상태와 관련성을 유지하기 위해 비교적 자주 업데이트해야 합니다. 환자의 활력 징후와 같은 일부 데이터 세트의 경우 이러한 업데이트가 몇 초마다 발생할 수 있습니다. 집 주소나 결혼 상태와 같은 다른 정보는 개인이 평생 동안 몇 번만 바뀔 수도 있습니다.
빅 데이터의 변동성, 즉 데이터 자산을 지속적으로 모니터링하지 않는 조직에서는 빅 데이터의 변동성을 파악하는 것이 과제가 될 수 있습니다.
공급자는 수동 업데이트가 필요한 데이터 세트, 자동화할 수 있는 데이터 세트, 최종 사용자의 다운타임 없이 이 프로세스를 완료하는 방법, 데이터 세트의 품질이나 무결성을 손상시키지 않고 업데이트를 수행할 수 있는 방법에 대해 명확한 아이디어를 가지고 있어야 합니다.
또한 조직은 단일 요소에 대한 업데이트를 시도할 때 불필요한 중복 기록을 만들지 않도록 해야 하며, 이로 인해 임상의가 환자 의사 결정에 필요한 정보에 액세스하는 것이 어려울 수 있습니다.
10. 공유
공급자는 진공 상태에서 운영되지 않으며, 한 곳에서 모든 치료를 받는 환자는 거의 없습니다. 이는 특히 산업이 인구 건강 관리 및 가치 기반 의료로 이동하는 과정에서 외부 파트너와 데이터를 공유하는 것이 필수적임을 의미합니다.
데이터 상호 운용성은 데이터 성숙도 스펙트럼에 따라 모든 유형, 크기 및 위치에 대한 조직의 지속적인 관심사입니다.
의료 정보 시스템 설계 및 구현의 근본적인 차이는 사용자가 서로 다른 조직 간에 데이터를 이동할 수 있는 능력을 심각하게 저하시킬 수 있으며, 임상의가 주요 의사 결정을 내리고 환자를 추적하며 전반적인 결과를 개선하는 전략을 개발하는 데 필요한 정보를 제공하지 못하는 경우가 많습니다.
업계는 현재 기술적 장벽과 조직적 장벽을 넘어 데이터 공유를 개선하기 위해 열심히 노력하고 있습니다. FHIR(Fast Healthcare Interoperability Resource) 및 API(Application Programming Interface)와 같은 새로운 도구와 전략으로 인해 조직이 쉽고 안전하게 데이터를 공유할 수 있게 되었습니다.
그러나 이러한 방법론의 채택은 다양하여 많은 조직이 환자 데이터의 원활한 공유에 내재된 가능성과 단절되어 있습니다.
의료 연속체의 모든 구성원을 신뢰할 수 있고 시의적절하며 의미 있는 정보로 연결하는 빅 데이터 교환 생태계를 구축하기 위해 공급자는 이 목록에 있는 모든 도전 과제를 극복해야 합니다. 그렇게 하려면 시간, 헌신, 자금 및 커뮤니케이션이 필요하지만 성공은 이러한 모든 우려의 부담을 덜어줄 것입니다.