Microsoft Excel змусив вчених перейменувати гени

Комітет HGNC (HUGO Gene Nomenclature Committee) випустив оновлене керівництво з найменування людських генів. Серед іншого організація повідомляє про зміну назв ряду генів, некоректно оброблюваних програмою Microsoft Excel. Ця програма з обробки табличних даних за замовчуванням конвертує назви начебто в дати, так що щоб уникнути помилок вченим довелося їх модифікувати.


Імена генам даються відповідно до номенклатурних вимог, розроблених HGNC - комітетом, відповідальним за коректні назви генів людини. Серед загальних принципів - ім'я повинно даватися англійською, бути коротким і містити інформацію про функції або структуру продукту. Крім повного імені гену дають абревіатуру, за якою його можна швидко знайти, наприклад для Tumor Necrosis Factor. Скорочення повинно складатися тільки з заголовних букв латинського алфавіту і арабських цифр, бути унікальним всередині геному і не мати негативного забарвлення. Крім цього рекомендовано взагалі уникати скорочень, що збігаються з генетичними термінами. Так, скоротити назву гена до буде дуже поганою ідеєю, - вона буде постійно плутатися з п'ятою хромосомою. Пошук генів з назвами начебто або теж проблематичний, тому імена, що збігаються з поширеними словами, теж не рекомендовані.


Крім нових рекомендацій у керівництві йдеться про перейменування кількох вже існуючих генів. Серед тих, хто потрапив під роздачу - скорочення на кшталт (одурманений, гальмівний, млявий від прийому наркотиків), і (тепер і) а заодно ціла група генів, які перейменували через їх некоректну обробку в Microsoft Excel. Скорочення начебто або програма за замовчуванням конвертує в дати, і пов'язані з цим помилки регулярно спливають у наукових роботах, - за оцінкою австралійських вчених вони є в кожній п'ятій статті, що містить додаткові excel-таблиці з генами.

Excel - найпоширеніша програма для обробки таблиць, і - хоч вона заточена зовсім не під роботу з генетичними даними - її регулярно для цього використовують. При цьому за замовчуванням вона конвертує в дати все, що схоже на дати, і будь-хто, хто не відключив цю опцію ручному режимі заздалегідь для окремих колонок отримає на виході некоректний список генів, при подальшій обробці якого теж можуть виникнути труднощі. Глобального вирішення цієї проблеми Excel не пропонує і не планує робити ці налаштування більш гнучкими, так що вченим довелося перейменовувати гени. Тепер ген скорочений як, а як, зміни торкнулися й інших аналогічних генів. Це перший випадок, коли зміна імені була обумовлена некоректною обробкою даних.

Правила найменування цілих організмів не такі суворі, - вони повинні бути написані латинськими літерами, підкорятися правилам латинської граматики і бути біноміальними, але при цьому першовідкривач хвиль зробити їх жартівливими, поетичними або увічнити в них людей або персонажів. Так, у нас вже є амеба-Гендальф, онихофора-Тоторо, хробак-Обама і комаха наїзник Елбакян. В описі виду повинна бути вказана причина вибору назви, але в цілому вона може бути викладена у вільному стилі.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND