结构化数据集

1200万项纪录

全部

病人基本资料

病人基本资料,包括性别和出生年份。


4400万项纪录

2000年起

急症室到诊

急症室病人到诊纪录,包括到诊日期(提供至月份)、入院时的年龄、分流类别及出院资讯。


8400万项纪录

1997年起

住院、转院及出院

住院纪录,包括入院及出院日期(提供至月份)、入院时的年龄、入院来源、入院专科及出院资讯。


5.23亿项纪录

2000年起

门诊预约

门诊预约及到诊纪录,包括预约日期(提供至月份)、到诊当日的年龄、到诊专科及预约类型(首次到诊或覆诊)。


1.02亿项纪录

全部

诊断

诊断纪录,包括病人的诊断结果、诊断状态以及诊断日期(提供至月份)。


3900万项纪录

全部

医疗程序

医疗程序纪录,包括医疗程序名称及日期(提供至月份)。


11.7亿项纪录

2000年起

药物纪录

配发处方纪录,包括配发药物及其相对应英国药物处方集(BNF) 编码、处方期限及处方剂量。


600万项纪录

2009年10月1日起

疫苗接种

医院管理局的疫苗接种纪录,包括注射日期(提供至月份)及所接种的疫苗。


4.38亿项记录

全部

家庭医学

病人疾病纪录,包括疾病日期(提供至月份)及ICPC2代码。


74.3万项记录

2002年起

产科

产科纪录,包括婴儿出生日期(提供至年份)、出生时体重、产次及妊娠周数。


25.38亿项纪录

2000年起

化验纪录

化验结果纪录,包括化学病理学、血液学及免疫学、微生物学及病毒学检测,并附化验结果日期(提供至月份)。


1.31亿项记录

自1999年4月1日起

放射检查

放射检查结果,包括放射检查登记日期(提供至月份) 、放射检查内容、病人进行放射检查预约当日的年龄。

非结构化数据集

1.3亿项记录

自1994年2月3日起

临床纪录/ 摘要

临床及出院纪录,包括纪录创建日期(提供至月份)及临床纪录的文字内容。


6500万项记录

自2000年起

化验报告

化验报告的文字内容。


2300万项记录

自1999年4月1日起

放射报告

放射检查报告的文字内容。


按研究项目而定

放射影像

放射影像(DICOM格式)的撷取时间依所需资料量而定,影像将于研究期内分阶段提供。

数据产品

14种慢性疾病的结构化数据:

32万个病人以上

慢性心脏衰竭 (CHF)

一种渐进性疾病,其特征为心脏泵血功能受损,导致血液循环不足。症状包括呼吸急促、疲劳、运动耐受力下降和水肿(脚、脚踝或腹部肿胀)。常见病因包括冠状动脉疾病、心肌梗塞病史或高血压。此疾病主要影响 65 岁以上的人士。


73万个病人以上

慢性肾脏病 (CKD) 第 3A, 3B, 4 和 5 期

慢性肾脏病指肾小球滤过率 (GFR) 低于 60 mL/min/1.73m²,或肾脏结构/功能异常持续三个月以上。相关诊断指标包括蛋白尿、尿沉渣异常或肾小管电解质紊乱。

第3A期:GFR 为 45 至 59 mL/min/1.63m²

第3B期:GFR 为 30 至 44 mL/min/1.73m²

第4期:GFR 为 15 至 29 mL/min/1.73m²

第5期(肾衰竭):GFR 少于 15 mL/min/1.73m²


18万个病人以上

慢性阻塞性肺病 (COPD)

一种可预防的渐进性呼吸系统疾病,主要由吸入有害颗粒或气体(例如吸烟)引发气道和肺组织慢性炎症,进而导致持续性气流受限。该疾病的急性发作和合并症(如心血管疾病)会加剧病情。


56万个病人以上

冠心病 (CHD)

全称冠状动脉心脏病 (CAD),是由冠状动脉粥状硬化造成动脉狭窄或阻塞,导致心脏血流量减少。常见症状包括心绞痛、运动性呼吸困难和心肌梗塞。风险因素包括年龄、吸烟、高血压、高血脂、糖尿病、肥胖以及早发性冠心病家族史。


27万个病人以上

认知障碍症

一种以认知能力逐渐退化为特征的综合症,主要症状包括记忆力衰退、推理能力受损、性格改变以及难以完成日常任务。常见病因包括阿尔兹海默氏症、脑血管损伤或神经退化性疾病,且症状会随着时间逐渐恶化。


85万个病人以上

糖尿病 (DM)

一种代谢疾病,以慢性高血糖为特征,主要因胰岛素分泌缺陷、胰岛素作用缺陷或两者兼有所致。此病会扰乱碳水化合物、脂质和蛋白质的代谢。亚型包括第一型糖尿病(自体免疫性)和第二型糖尿病(胰岛素抗性)。


25万个病人以上

青光眼

一组以眼球压力过高为特征的眼部疾病。其病因是房水引流障碍,压迫视网膜和视神经,进而令患者视神经受损并丧失视力。


31万个病人以上

乙型肝炎帶菌者

指持续感染乙型肝炎病毒(HBV)的患者,其定义为对乙型肝炎病毒表面抗原或脱氧核糖核酸测试呈阳性反应持续超过六个月。乙型肝炎带菌不论肝功能是否正常,均面临较高的肝硬化和肝细胞癌(HCC)风险。


16万个病人以上

髋关节骨折(类似于骨质疏松症)

指发生在股骨近端(大腿上部)的骨折,主要成因包括创伤或骨质疏松症。此类骨折常见于老年人,并伴随活动能力下降。


129万个病人以上

高血脂 (HLD)

一组以血液脂蛋白水平升高为特征的代谢疾病,包括低密度脂蛋白(LDL)胆固醇和/或甘油三酯过高。此病症是导致动脉粥样硬化及心血管疾病的主要风险因素。


210万个病人以上

高血压 (HT)

在高血压分类中,原发性高血压占病例 95%,是指原因不明的持续性高血压。其主要风险因素包括年龄、肥胖、盐敏感性和遗传倾向性。


7万个病人以上

柏金逊综合症

其定义为动作迟缓并伴随以下至少一项症状:静止性震颤、肌肉僵硬或姿势不稳。病因包括柏金逊病、药物引起的多巴胺阻断、血管病变或神经退化性疾病。


22万个病人以上

中风

亦称脑血管意外(CVA),是因深静脉血栓、栓塞或出血导致的突发性脑缺血(脑缺血)。常见症状包括偏瘫、失语症和意识改变。主要风险因素包括高血压、心房颤动、糖尿病、吸烟和年龄。


20万个病人以上

抑郁症

一种以持续悲伤、快感缺乏、疲劳、睡眠障碍和自杀意念为特征的情绪障碍。约 15 至 25% 的癌症患者会出现此症状,该病症可透过心理治疗和/或药物治疗改善。


 

 

11种癌症的结构化数据(患病率由香港癌症资料统计中心提供):

8万个病人以上

大肠癌

结肠或直肠中出现的恶性肿瘤,通常由腺瘤性息肉引起。


6万个病人以上

女性乳癌

最常见的是乳管癌或小叶癌,分别源自乳房导管或乳房腺体。侵袭性癌症会扩散至原发部位以外。


8万个病人以上

肺癌

主要分为小细胞(侵袭性、与吸烟有关)或非小细胞(例如腺癌、鳞状细胞)两种。


3万个病人以上

前列腺癌

前列腺腺癌,主要影响老年男性。


3万个病人以上

肝癌

主要分为原发性(肝细胞癌)或继发性(从其他器官转移扩散)两种。


1万个病人以上

鼻咽癌

鼻咽上皮恶性肿瘤,与流行地区的艾巴氏病毒有关。


2万个病人以上

胃癌

胃黏膜腺癌,亦称胃癌。


1万个病人以上

子宫体癌

子宫体恶性肿瘤(例如:子宫内膜癌、平滑肌肉瘤)。


9千个病人以上

卵巢癌

包括上皮癌(最常见)和生殖细胞肿瘤。常于晚期才被诊断出来。


8千个病人以上

子宫颈癌

子宫颈恶性肿瘤,常与人类乳头瘤病毒(HPV)感染有关。


1万个病人以上

非霍奇金淋巴瘤

多种淋巴球癌(B 细胞或 T 细胞来源),不同于霍奇金淋巴瘤。