概览:

医弘数科数据实验室的技术平台为研究人员提供一个安全的环境以探索医疗数据及进行数据分析。本平台旨在支援完整的研究生命周期,实现无缝的数据处理、应用程式编码、模型训练和数据验证。

本平台采用多租户架构并运行于隔离网络,确保严格的数据隔离与保护。研究人员可通过本平台使用数据,但无法自行复制、下载或汇出数据。所有档案的汇入及研究成果的汇出均由数据实验室办公室管理,以保障数据安全。

 

硬件及软件:

在 EXPERT 服务中,数据会以 CSV 档案格式储存在 Hadoop 丛集内。本平台提供专用硬件,例如虚拟机器和 GPU 资源,协助研究人员有效存取数据并进行分析。

为支援各类研究活动,本平台同时配备一系列常用的开源软件工具,包括Python、R、DICOM检视器及办公生产力应用程式等。

软件类型

数据实验室平台可用软件

分析与编码工具

R (套件列表)

RStudio Desktop for Windows

Python (模组列表)

Jupyter

GNU PSPP

DICOM 检视器

Sante DICOM Viewer Lite

itk-SNAP

办公生产力应用程式

Libreoffice

Notepad++

档案汇入服务:

研究人员可申请将自已的档案(例如数据集、程式脚本和软件工具)汇入本平台以支援其研究工作。所有汇入的档案均需经数据实验室办公室审核,以确符合数据安全、私隐和其他相关要求。一般而言,待汇入的档案应符合以下条件:

  • 所有档案必须为合法拥有、取得正式授权或明确标示为可自由使用,无版权或授权争议;
  • 不包含任何敏感资讯或任何可能导致个人、家庭或机构身分被重新识别的资料;
  • 与数据实验室平台基础设施相容,且不包含任何电脑病毒或恶意程式。