跳过导航,转到内容

机器学习DATATHON COVID-19徽标

SBMI DATATHON 2021进行中风预测

注册截止日期:3月25日Th,2021


比赛日期:3月27日Th- 28Th,2021


共同组织者:
Shayan Shams,Yejin Kim,Xiaoqian Jiang,Sean Savitz

关于Datathon


2017年,美国有780万成年人报告中风了。虽然归因于中风的死亡已经下降,但中风仍然是发病率和残疾的主要原因。到2030年,与中风相关的成本预计将达到1830亿美元。尽管早期治疗,但中风幸存者通常患有严重的长期残疾,包括身体和认知问题,需要不断受到社区的监测和护理。康复对于康复至关重要,在受伤后不久就开始了大脑特别接受可以增强修复的过程的过程。康复疗法的适当数量,质量和时机尚不清楚,无法有效地优化结果和补救障碍。准确预测中风急性阶段的功能和认知结果对于个性化的康复计划以及改善患者,家庭和临床医生在可能的结果和期望方面的沟通很重要。


主题


该数据录的主题是要求参与者竞争算法的发展,以预测住院康复期间认知和功能独立性度量(FIM)分数(18个子类别)的变化(每个子类别的入院FIM分数与出院之间的差异)。FIM分数在北美广泛使用,以衡量残疾。它包括十八个评估项目子类别,分为六个部分。FIM评估了运动功能和认知功能,而FIM得分的增加意味着功能提高,而降低分数意味着患者的功能状况下降。

每个类别的FIM分数范围从1到7,其中:

7 6 5 4 3 2 1
完全独立 修改的独立性 监督 最小的帮助 温和的援助 最大帮助 总协助或不可测试

客观的

预计参与者将开发算法,以预测从入院到出院的每个子类别的住院康复期间FIM评分的变化。

预测变量

预测变量由连续变量和分类变量组成。尽管已经在组织和清洁数据集方面投入了大量努力,但希望参与者能够使用新颖的策略来处理预测变量中缺少的价值。


评估


在这项机器学习挑战中,我们要求参与者(以合理的方式)建立模型,并根据L1(曼哈顿)距离评估最终性能L1距离的示例表示FIM分数的实际和预测变化(即P子类别)。如果表现有联系,则应将参与者的绩效绑定,将对模型的解释性和预测变量重要性的识别进行额外考虑。

最终输出的示例:

ID 饮食改变 沐浴变化 内存更改
100 5 7 1 ... 3 2
101 2 7 3 2 5
102 4 3 1 1 2

数据说明

火车数据以下格式位于单个CSV文件(Train.csv)中:

train.csv文件的图像

该标签包含18个FIM子类别,并有望预测参与者的矢量(18),其中矢量中的每个值代表每个子类别的入学FIM评分和放电的差异。


竞争规则


  • 参与者必须以独立的方式提交源代码(例如,Jupyter笔记本电脑)。
  • 严格禁止从我们的服务器下载数据并在竞争后在本地保存这些数据以供当地使用。
  • 不允许在竞争期间私下共享我们提供的环境之外的数据。
  • 参与者必须使用算法方法进行预测。对方法的任何更改都必须以自动化的方式进行,以便可以将方法推广到新主题。
  • 允许使用外部数据。
  • 要求所有参与者准备将描述其模型的摘要幻灯片。
  • 将要求前三名参与者作简短的演讲,排行榜上的前十名参与者可能有机会在期刊特刊(在谈判中)中发布其结果。
  • 参与者最多可以提交10个条目。出于最终判断的目的,具有最佳性能的条目。


奖品


uthealth赞助的总计1,500美元

  • 第一名:$ 1000
  • 第二名:$ 300
  • 第三名:$ 200


常见问题解答


经常问的问题

本科生和研究生目前正在参加硕士课程的第一年/第二年或博士学位的头两年。来自墨西哥湾沿岸财团内部机构的计划(包括Uthealth,MDACC,UH,RICE,TAMU,UTMB,IBT和BAYLOR等)。此外,鼓励来自休斯顿地区的合格学生(例如HBU,SHSU,TSU,PVAMU,圣托马斯大学,UH-Clear Lake,UH-Sugar Land和UH-Victoria等)申请。
不,这场比赛是免费的。
不,由于Covid-19-19的大流行,比赛将被远程举行。我们的团队将为您提供所需的VPN并访问编码环境。
这是一个编码Datathon。期望您掌握了基本的编程技能并了解机器学习。
我们的专家小组由Uthealth生物医学信息学学院的教职员工组成。您的项目将通过自动排行榜计划进行评判;每个参赛者只能提交10次。在活动结束时,将要求前三名参赛者在他们的解决方案上进行简短的介绍。


Baidu