有时候,“重写”基因比等待Excel更新更简单。
Excel的日期默认修改功能给科学家们带来了困扰,在科学研究中,基因的名称一般由字母加数字的形式组成。但是,在使用Excel时,某些基因名称会被误读为日期格式,并被Excel直接修改成日期格式。
因为便捷的计算功能,Excel一直是科学家们分析数据时的首选,但是当Excel将一些关键数据误读,而科学家们恰好使用这些数据来分析,甚至临床试验的时候,就可能产生不可挽回的严重后果。
当遇到类似情况时,科学家们必须手工设置单元格格式以还原数据,但难免也会产生遗漏的情况。据一项 2016 年的调查表明,这类 Bug非常普遍,以至于在3597篇样本论文中,约五分之一都受到了影响。
遗憾的是,Excel没有关闭自动修改格式的开关,为了避免自动修正,只能重设整列单元格数据类型。但是这种修复是一次性的,一旦其他人引用了相关数据,问题会再次出现。
本着求人不如求己的理念,科学家们修改了27种人类基因的名称,并且对基因命名规则做出调整,以便在今后对基因命名时避开Excel问题。
国际人类基因组组织(HUGO)下辖的基因命名委员会( HGNC)近期发布了 “影响数据处理和索引的符号” 的基因命名格式的新指南,例如:MARCH1 将变为 MARCHF1;SEPT1 变为 SEPTIN1。
为什么选择重新命名人类基因,而不是要求Excel修复这个问题? HGNC发言人表示,这只是Excel使用中的极少数情况,而且,当科学家自己能够提出一个长远的解决方案时,为什么还等待一个漫长的虚无缥缈的Excel更新呢?
HGNC还表示,同永恒的人类基因相比,Excel不过转瞬即逝。