在医疗决策中,医生往往依赖于个人经验和直觉,而非数据中蕴含的丰富知识,这可能导致错误和成本增加,影响医疗服务质量。通过使用分析工具和数据建模,可以帮助提升临床决策的质量。因此,本项目的目标是构建一个网页应用程序,以协助医生诊断心脏病。项目的完整代码可以在GitHub仓库中找到。
从UCI机器学习库收集了心脏病数据集。该数据集包含以下14个属性:
- 年龄:以年为单位的年龄。
- 性别:性别(1=男性;0=女性)。
- 胸痛类型:胸痛类型(0=典型心绞痛;1=非典型心绞痛;2=非心绞痛;3=无症状)。
- 静息血压:入院时的静息血压,单位为毫米汞柱。
- 血清胆固醇:血清胆固醇含量,单位为毫克/分升。
- 空腹血糖:空腹血糖是否超过120毫克/分升(1=是;0=否)。
- 静息心电图结果:静息心电图结果(0=正常;1=ST-T波异常;2=可能或确定的左心室肥大)。
- 最大心率:达到的最大心率。
- 运动诱发心绞痛:运动是否诱发心绞痛(1=是;0=否)。
- ST段压低:运动引起的ST段压低与静息时相比。
- 斜率:峰值运动ST段的斜率(0=上升;1=平坦;2=下降)。
- 主要血管数量:由荧光镜检查着色的0-3个主要血管。
- 地中海贫血:地中海贫血(3=正常;6=固定缺陷;7=可逆缺陷)。
- 目标:心脏病(1=无,2=有)。
数据准备与探索
以下是数据集的前五行。
import pandas as pd
df = pd.read_csv('heart.csv')
print(df.head())
通过上述Python代码,可以使用pandas库读取CSV文件,并打印出数据集的前五行。这有助于初步了解数据集的结构和内容。