تقنيات مرجعية لفك
التباس نتائج بحوث الخلايا المفردة
نشرت بتاريخ 1 فبراير 2023
في المجالات التي تشهد تطورات سريعة الخطى، كمجال بيولوجيا الخلايا
المفردة، تعمل الدراسات التي تقارن بين المنهجيات البحثية المختلفة، على مساعدة
العلماء في اختيار التقنية الصحيحة لبحوثهم.
آمبر دانس
شهد مجال بيولوجيا الخلايا المفردة
نشوب طفرات ثورية خلال العقد الماضي. فبالرجوع إلى قاعدة بيانات الدوريات العلمية،
«بابميد» PubMed، للفترة بين عامي 2015 و2021، تبين أن استخدام مصطلح الخلية
المفردة، ارتفع بمعدل ثلاثة أمثال ما كان عليه قبل تلك الفترة؛ وهو توسع قادته إلى
حد كبير، الابتكارات التقنية في مجال عزل الخلايا المفردة، ومحتوياتها الجزيئية.
يستخدم الباحثون هذه التقنيات
المبتكرة، إضافة إلى العديد من التقنيات الأخرى، لسير الخلايا المفردة، لأغراض شتى،
بدءًا من الوقوف على شكل التعبير الجيني لتلك الخلايا، انتهاءً إلى رصد مدى تأثرها
بالتغيرات فوق الجينية، وقياس مدى نشاط عوامل النسخ فيها، ودراسة التواصل بين خلية
وأخرى.
تؤكد ذلك سامانتا موريس، المتخصصة
في البيولوجيا النمائية من جامعة واشنطن، في مدينة سانت لويس، بولاية ميسوري
الأمريكية، قائلة: "صار سبر مجال بيولوجيا الخلايا المفردة متاحًا لقطاع
جماهيري أكثر اتساعًا".
لكن رغم أن كثرة تقنيات معالجة
السوائل، وطرق التحليل أتاحت معها دراسة الخلايا المفردة لقطاع أوسع من الباحثين، إلا
أن هذا الطيف الشاسع من الخيارات مربك ومحير للباحثين عند محاولتهم اختيار الطريقة
الأنسب لإجراء تجاربهم. على سبيل المثال، تدرج قائمة على الإنترنت للأدوات
المستخدمة في دراسات الحمض النووي للخلايا المفردة، باسم scRNA tools، 1400 حزمة تقريبًا،
من حزم البرمجيات التي تستقي من بيانات الخلايا المفردة رؤى علمية. فكيف يفترض بالباحثين
اختيار المنهجية المناسبة لهم من بين هذا التنوع الهائل من الأدوات؟
حول ذلك، يقول جاير شيتيل ساندفِه،
المتخصص في نظم المعلومات البيولوجية، من جامعة أوسلو: "عندما تشرع في إجراء
أي دراسة، سيتعين عليك أن تختار، ويُتوقع منك، كباحث، أن يكون لاختيارك ما
يبرره".
وما يستقر عليه العلماء من خيارات مهم، بحسب ما يقول أيضا خوليو
سايز-رودريجيز، المتخصص في الحوسبة البيولوجية، من جامعة هايدلبيرج بألمانيا،
ويضيف: "حتى التغير الطفيف في الأدوات المستخدمة، يمكن أن يفضي إلى اختلافات ملموسة
في النتائج".
ويمكن التخلص من الحيرة التي تخلقها وفرة طرق التحليل، في هذا المجال، من
خلال منهجيات قياس أداء مرجعية؛
أي اختبارات، تجريها أطراف محايدة، لعدد من الطرق التي يشيع الاعتماد عليها لدى التصدي
لدراسة العديد من أنواع مجموعات البيانات، بهدف تحديد أي الطرق هي الأفضل لهذا
الغرض البحثي أو ذاك. فمنذ فجر بحوث الخلايا المفردة، أجرى العلماء عشرات
المقارنات بين شتى طرق معالجة السوائل وخوارزميات تحليل البيانات في هذا المجال.
وهي مقارنات يمكن أن يستدل منها الباحثون على الطريقة الأنسب لبحوثهم. ورغم أن بعض
الباحثين يرى أن هذه الجهود لم تنل التقدير الذي تستحقه من جانب الجهات الممولة
للبحث العلمي، فقد أخذت مبادرات جديدة تقدم الدعم وتضفي الموثوقية لمثل هذه
الدراسات التي ترسي معايير قياس أداء مرجعية.
تعقيبًا على ذلك، تقول موريس: "البحوث
المنشورة لإرساء معايير قياس مرجعية، ضرورية تمامًا، وتعد إسهامًا مهمًا للمجتمع
العلمي".
جدير بالذكر أنه عند الشروع في إجراء
دراسة في مجال الخلايا المفردة، تكون أول عملية اختيار تواجه الباحث هي نوع
التقنية التي يتعين عليه استخدامها لفصل الخلايا، وتحليل جزيئاتها. وتتمثل الطريقة
الشائعة لذلك، في حال تعيين تسلسل الحمض النووي الريبي لخلايا مفردة (scRNA)، في تقسيم
أجزاء الخلايا المفردة أولًا بين أحواض أو قطيرات، ثم إجراء نسخ عكسي للحمض النووي الريبي في الخلايا، للحصول
على حمض نووي مُكَمِّل (cDNA). ويعقب ذلك استخدام جزيئات تخدم كأداة ترميز شريطي، لوسم الحمض
النووي المكمل بكل حوض بوسم مختلف. وفي الخطوة التالية، يجري تضخيم تسلسل الحمض
النووي المكمل الموجود في كل خلية، لبناء مكتبة من بيانات الحمض النووي، ثم تجري
قراءة تسلسل خيوط الحمض النووي المكمل، وما عليها من واسمات. وأخيرا، تُستخدَم واسمات
الترميز الشريطي تلك للتأكد من انتساب كل قطعة من الحمض النووي الريبي، إلى الخلية
التي أنتجتها. غير أن ثمة الكثير جدًا من الطرق الأخرى، التي يمكن أن يعتمد عليها العلماء،
لتنفيذ هذه المهام.
Credit: Pavlo Gonchar/SOPA Images/Shutterstock
اختبارات أداء مرجعية
في عام 201
7، جوشوا ليفين، عالم
الوراثة والبيولوجيا الجزيئية من معهد برود، التابع لمعهد ماساتشوستس للتكنولوجيا،
وجامعة هارفارد في كامبريدج، بولاية ماساتشوستس الأمريكية، أجرى بالتعاون مع فريقه
البحثي، مقارنة بين سبع من الطرق التي تُستخدَم للوقوف على تسلسل الحمض النووي
الريبي للخلايا المفردة. ووجد الفريق أن طريقتين من السبع تتسمان بانخفاض
الإنتاجية؛ إذ يمكن باستخدامها تحليل مئات الخلايا فقط، لكنهما تتسمان بدقة عالية تكفي
لرصد الأنواع النادرة من الحمض النووي الريبي، والأنواع النادرة من الخلايا أيضًا.
أما الطرق الخمس الباقية فكانت مرتفعة الإنتاجية، ويمكن من خلالها التصدي لدراسة
آلاف الخلايا.
استخدم الفريق هذه الطرق الخمسة مع
ثلاث عينات1. وشملت إحدى العينات خلايا دم بشرية محيطية أحادية النواة
(PBMCs)؛ ما جعلها مناسبة
لإجراء الاختبارات عليها، بحسب ما يقول ليفين، لأن العلماء وعوا بالفعل أنواع
الخلايا التي يفترض أن تنطوي عليها تركيبة هذه العينات. كما فطنوا إلى البصمة
الجزيئية لتلك الخلايا. وباستخدام خليط من خطوط خلايا الفئران، وخلايا البشر، تمكن
الباحثون من رصد الحالات التي حلت فيها خلية فأر وخلية إنسان في الحوض نفسه. ولأن
ذلك جعل الجينات البشرية وجينات الفأر، تبدو وكأنها تتشارك الترميز الشريطي نفسه،
فقد عد الباحثون ذلك دليلًا واضحًا على عدم صلاحية الطريقة التي أفضت إلى هذا
الخطأ. كذلك اختبر الفريق فاعلية أربع طرق، ووجدوا أنها مناسبة لتعيين تسلسل الحمض
النووي الريبي للأنوية المُفردة؛ وهو من شأنه أن يجعل هذه الطرق مناسبة للأنسجة التي
يصعب فيها تفكيك الخلايا المفردة. وقد استخدم الفريق البحثي في هذه الاختبارات، نسيجا
دماغيًا؛ لأن أنسجة الدماغ كثيرًا ما تستهدفها تلك الدراسات.
يتوقف اختيار الطريقة المثلى، على نوع
مجموعات البيانات التي يملكها الباحث، والأسئلة التي تسعى الدراسة إلى الإجابة
عنها. على سبيل المثال، لدى اختبار أداء الجيل الثاني من تقنيات تعيين تسلسل الحمض
النووي الذكية، التي تعرف اختصارًا باسم «سمارت-سيك2» Smart-Seq2، وتلك التي
تعرف باسم تقنيات الجيل الثاني لتعيين تسلسل الحمض النووي الخلوي، أو اختصارًا «سِل-سيك2»
CEL-Seq2، وهما
طريقتان منخفضتا الإنتاجية، وُجد أنهما متشابهتان في الأداء؛ فقد أمكن من خلالهما
الوقوف على معظم التركيب الجيني للخلايا، وإن كانت الطريقة الأخيرة أخطأت أحيانًا،
فنسبت بعض تسلسلات الحمض النووي الريبي إلى غير الخلية التي أتت منها. تعليقًا على
ذلك، يقول ليفين إن من عيوب هاتين الطريقتين، ارتفاع تكلفتهما. أما الطرق ذات
الإنتاجية المرتفعة، فكان من أفضلها أداءً، نظام يعرف باسم «10 إكس كروميوم» 10X Chromium
system. وهو يستطيع رصد معظم الجينات في الخلية. ويقسم هذا النظام عينات
الخلايا إلى قطيرات، وقد طورته شركة «10 إكس جينومكس» 10X Genomics، في مدينة بليسانتون،
بولاية كاليفورنيا الأمريكية.
ويضيف ليفين أن واحدا من أكبر
التحديات التي تواجه دراسات قياس الأداء المرجعية، هو ضمان سير استخدام جميع التقنيات
بحيادية. من هنا، تحسبًا لتأثير الاختلافات بين التجارب، عمد فريق ليفين إلى تحضير
مجموعة واحدة من العينات، واستخدموها مع كل طريقة. وعندما وصل أعضاء الفريق إلى خطوة
الوقوف على تسلسل الحمض النووي، حفزوا التفاعل لكل طريقة في الحجيرة نفسها من جهاز
قراءة تعيين تسلسل الحمض النووي. وابتكر الفريق أيضًا مسارا واحدا لعمليات الحوسبة،
كي تتم معالجة البيانات بطرق متماثلة قدر الإمكان. بعد ذلك، أجرى أعضاء الفريق كافة
التجارب بأنفسهم، لكن ذلك لا يعني بالضرورة أنهم جميعًا تمتعوا بالخبرة في استخدام
كل هذه الطرق. لهذا، لجأوا، في اختبار كل طريقة غير مألوفة لهم، إلى المختصين الذين
طوروها، لمساعدتهم على استخدامها على النحو الصحيح.
واعتمد فريق آخر، يقوده هولجر هاين،
وهو متخصص في التقنيات الحيوية من المركز الوطني للتحليل الجينومي في برشلونة
بإسبانيا، على طريقة مختلفة2. إذ أوكل الفريق عملية الاختبار إلى
المختصين في كل طريقة من طرق التصدي لدراسة الخلايا المفردة، أو النوى المفردة؛ وأُرسِلَت
عينات من أنابيب الاختبار نفسها، إلى 13 مركزا بحثيا حول العالم. في ذلك الصدد، يقول
هاين: "تتطلب تقنيات الخلايا المفردة مهارات وخبرات قوية، لإجراء التحليل على
نحو سليم، والحصول على أفضل نتيجة ممكنة".
واختار أعضاء فريق هاين لتحضير عينتهم،
خليطا من خلايا الدم المحيطية أحادية النواة، المأخوذةٍ من أنسجة القولون البشري،
وقولون فئران. ووجد الفريق البحثي أن أنسجة القولون البشري، أمكن للتحليل بالوقوف
بدقة على أنواعها. فقد احتوى نسيج القولون البشري على خلايا في أطوار التمايز من
خلايا جذعية إلى خلايا قولون تامة التمايز. وهو ما وفر فيضًا متصلا لأطياف، وحجوم
متدرجة، من الخلايا.
وللتحقق أكثر من كفاءة تلك الطرق،
في رصد أنواع الخلايا النادرة، أضاف الفريق كميات محددة من خطوط خلايا لإنسان أو فأر
أو كلب، بعد وسمها بواسمات متألقة. وأدى "تضخيم" العينة التي حوت هذه
الأنواع المحددة من الخلايا المضافة إلى خلائط خلوية محددة أخرى، إلى مساعدة العلماء
على مقارنة ما يرصدونه من خطوط خلايا بكميات الخلايا التي يدركون أنها موجودة في
العينة. فعجزت إحدى الطرق التي تم اختبار أدائها في دراسة هاين، على سبيل المثال، عن
رصد أي وجود لخلايا كلبية، رغم أن تلك الخلايا كانت تشكل 1% من الخليط، في حين
بالغت طريقة أخرى في تقدير نسبة خلايا الكلب في الخليط، فقدرت أنها توجد بنسبة 9%
من مجموعة الخلايا.
ويرى هاين أن الطرق التي يجري فيها
تقسيم الخلايا بين أحواض دقيقة، محفورة على طبق معايرة دقيقة تعطي في الغالب نتائج
عالية الجودة، لكنها محدودة الإنتاجية، مقارنة بتقنيات الموائع الدقيقة، التي
تقسَّم فيها عينة الخلايا إلى قطيرات. ووجد الفريق أيضًا أن تقنية «سِل-سِك2»، وتقنية
أخرى تعرف باسم «كوارتز-سك2» Quartz-Seq2، كليهما، تتفوقان في اكتشاف الجينات. وتتميز الطريقة «سل-سك2»،
تحديدًا، بالقدرة على اكتشاف قطع الحمض النووي الريبي المرسال، التي يجري نسخها جينيًا
بكميات ضئيلة. غير أن الطريقة «كوارتز-سك2»، تفوقت في المجمل، من حيث الأداء؛ إذ أحرزت
نتائج جيدة أيضًا في تصنيف الخلايا، اعتمادًا على ما تنتجه هذه الخلايا من واسمات
بيولوجية معروفة.
تقييم أداء الخوارزميات
ما أن يستقر العلماء على آلية قياس
معينة، يكون عليهم انتقاء وسيلة لتحويل بيناتهم الأولية إلى نتائج تسفر عن دلالات.
هنا، تكثر الخيارات مرة أخرى. وتعتمد بعض الخوارزميات على البيانات الناتجة من
تعيين تسلسل الحمض النووي الريبي، من أجل تصنيف الخلايا إلى مجموعات، حسب نوعها،
أو من أجل اكتشاف مسار التعبير الجيني الذي يعكس تطور نوع من الخلايا إلى نوع آخر.
وتضطلع خوارزميات أخرى بمهمة دراسة تسَلْسُلات الحمض النووي؛ لتحديد تركيبها
الكروماتيني، وتحليل تأثيرات عوامل النسخ، أو أخذ قياسات الجزيئات التي استُخدِمت
في التواصل بين خلية وأخرى. وتستطيع بعض الخوارزميات أيضا أن تجمع بين بيانات مستقاة
من تجارب مختلفة؛ ما يتيح الأخذ بالحسبان الاختلافات التي قد تكون موجودة بين مجموعات
البيانات التي جرى تحليلها في أوقات مختلفة، أو بمعرفة باحثين مختلفين.
وهنا، يفيد مارك روبنسون، المتخصص
في الحوسبة البيولوجية، من جامعة زيوريخ، في سويسرا، بأن القائمين على دراسات قياس
الأداء المرجعية، يقَيِّمون تقنيات التحليل، من حيث مدى دقتها في تنفيذ المهام،
لكن بعض المعايير تعتمد على نوع المهمة. على سبيل المثال، قد يلجأ العلماء الذين
يجرون دراسات كتلك، تستهدف تصنيف الخلايا، ووضع كل مجموعة من الخلايا المتشابهة في
حزمة مستقلة، إلى التحقق من متوسط تناغم البيانات، وهو القياس الذي ينبني على حساب
عدد التصنيفات الصحيحة التي تنجزها الطريقة فعليًا، وحساب مدى تقارب هذا العدد مع العدد
الكلي الممكن للتصنيفات الصحيحة. في المقابل، قد يلجأ العلماء الذين يريدون التحقق
من دقة الطريقة في حساب الاختلافات في التعبير الجيني، إلى اختيار الاعتماد على
القوة الإحصائية؛ وهي مقياس لمدى احتمالية اكتشاف مثل هذه الاختلافات. وربما يختار
الباحثون في هذه الدراسات أيضا، تقييم عدد من المقاييس الأخرى، مثل الكفاءة، ومتطلبات
عملية الحوسبة، وجودة عمليات التوثيق، وما إذا كانت الخوارزمية من مصدر مفتوح
ومتاح للجمييع.
ويستطيع العلماء أن يستخدموا نوعين
من البيانات، كَمُدخَلات، هما البيانات الحقيقية المأخوذة بالفعل من الخلايا، والبيانات
الاصطناعية، التي يمكن استحداثها من خلال برمجيات معينة، مثل «سبلاتر» Splatter، وهو برنامج
يستطيع محاكاة بيانات تسلسل الحمض النووي الريبي للخلايا المفردة. وتمثل محاكاة
البيانات نقطةَ انطلاق جيدةً في هذه العملية؛ لأنها تتيح ما يمكن تسميته بـ"اختبار
السلامة"، بحسب ما يقول ساندفِه، الذي يضيف قائلا إن الباحثين يعرفون بدقة
المعطيات التي وضوعها في خط معالجة البيانات، ومن ثم يعرفون ما الذي ينبغي أن ينجم
عن تلك المعالجة.
غير أن بيانات المحاكاة، لا يمكن
أن تغني عن بيانات التعقيد البيولوجي الحقيقي على الإطلاق، لأن الباحثين لا
يستطيعون محاكاة تعقيد لا يفهمونه بالكامل، بحسب ما تقول كيم-آن لي كاو، المتخصصة
في الإحصاء الحوسبي من جامعة ملبورن، في مدينة باركفيل الأسترالية. وتتسم الخلايا الأصلية
بتعقيد حقيقي. فيقول سايز-رودريجيز: "عيب المحاكاة، يتمثل في أننا قد لا نحصل
على صورة واقعية لحقيقة الحال".
وفي الحالات المثلى، يختبر العلماء
كفاءة طرق التحليل، بالرجوع إلى مجموعات بيانات مرجعية تكون فيها بيولوجيا الخلايا،
وأنواعها، قد جرى توصيفهما جيدًا، وهو ما يمَكِّنُهم من التنبؤ بالنتائج. هناك،
على سبيل المثال، قاعدة بيانات تعرف باسم «ديسكو» DISCO، وتضم معلومات
واسعة الشمول عن وراثيات الخلايا المفردة، وتعتمد على مجموعات بيانات بحوث منشورة حول
طيف عريض من أنواع الأنسجة، والأمراض، ومنصات التحليل.
أُجريت أكثر من 60 دراسة مرجعية، حول
تقنيات حوسبة ومعالجة بيانات الخلايا المفردة، طبقا لتحليل تجميعي نشره روبنسون، كمسودة
بحثية، على منصة تخزين البيانات، المعروفة باسم «بيوآركيف» bioRxiv، في شهر
سبتمبر3 من العام 2022؛ ومن ثم يجد العلماء الذين يبحثون عن طريقة مثلى،
أنفسهم أمام وفرة من الخيارات. ويقترح ساندفِه على الباحثين، أن يسعوا إلى البحث
عن طرق تحليل محايدة، لأنه من الطبيعي أن يميل مطورو الخوارزميات الجديدة، إلى
إبراز ميزات تقنيتهم. لذلك، وبناء على نصائح المختصين، يتعين على العلماء أن
يبحثوا عن تقنيات تتسم بالكفاءة في معالجة مجموعات بيانات تشبه مجموعات بياناتهم،
وأن يجربوا مع بياناتهم استخدام بضع طرق، قبل أن يستقروا على الطريقة الأنسب.
وليس من الضرورة أن تكون أكثر التقنيات
تطورًا هي الأفضل دائمًا. على سبيل المثال، لوكا بينيللو، المتخصص في الحوسبة
البيولوجية، من مستشفى ماساتشوستس العام وكلية طب هارفارد، في بوسطن، عقد مع جيسون
بوينروسترو، المتخصص في الوراثة فوق الجينية، بجامعة هارفارد في كيمبريدج، وزملائهما،
مقارنةً بين عدة تقنيات للتمييز بين أنواع الخلايا، اعتمادًا على شكل توفُر
الكروماتين بها؛ وهو نسق يرتبط بالتعبير الجيني4. وعندما استحدث الفريق
البحثي مخططًا بيانيًا، للعلاقة بين زمن معالجة البيانات في هذه العملية وجودة النتائج،
فوجئوا بعدم وجود علاقة بين الاثنين. تعقيبًا على ذلك، يقول بينيللو: "أحيانا،
لا يؤدي استخدام التقنيات المتطورة شديدة التعقيد إلى تحسين الأداء". يعني
ذلك، أن العلماء الذين لا تتاح لهم سوى مصادر حاسوبية محدودة، لا يزال بمقدورهم
العثور على خوارزمية تعطي نتائج جيدة.
وأحيانًا لا يتأتى الحل باختيار
طريقة مثلى بعينها، بل بالاعتماد على عدة طرق. وهذا ما توصل إليه سايز-رودريجيز وفريقه
البحثي، بعد أن قاموا بقياس أداء بعض الطرق، لاستنتاج مسارات التواصل بين الخلايا وبعضها،
من خلال بيانات تسلسل الحمض النووي الريبي لخلايا مفردة، ولم تسفر هذه الطرق على
اختلافها نتائج تتفق مع بعضها البعض إلا في قدر محدود منها5. حول ذلك،
يقول سايز-رودريجيز إن مسارات التحليل المتعددة، إذا أعطت النتيجة نفسها، فمن
المرجح أن تكون هذه النتيجة صحيحة. ويضيف أن فريقه طور أيضًا إطار عمل مفتوح
المصدر، يُعرف باسم «ليانا» LIANA؛ وهو نظام يسمح لمستخدميه بتشغيل خوارزميات متعددة، لمعالجة
مجموعات عديدة من البيانات، وهو ما يتيح مقارنة عادلة وغير متحيزة. ويستطيع النظام
أيضًا أن يوفر نتائج تُجمِع على صحتها كافة الطرق التي اتبعت.
أطنان من المهام
رغم وضوح أهمية دراسات قياس الأداء
المرجعية، يرى علماء أن مثل هذه الدراسات لا تحظى بتمويل أو تقدير جيد. فيقول بوينروسترو
في أسى: "لا تعود الفائدة من مثل هذه الأبحاث على المجتمع الأكاديمي".
لكن هذا الوضع بدأ يتغير. على سبيل المثال، تقول
إيفانا جيليك، مديرة برنامج علوم البيولوجيا الحاسوبية، التابع لمبادرة تشان
زوكربيرج، في مدينة رِدوود، بكاليفورنيا، أن المبادرة أنفقت عشرات الملايين من
الدولارات، في إجراء دراسات قياس الأداء المرجعية، ودراسات أخرى ذات صلة ببيولوجيا
الخلايا المفردة. وتضيف جيليك أن فرص حصول هذه الدراسات على مزيد من التقدير
تتنامى.
ويجد بوينروسترو، على سبيل المثال،
باعثًا على الحماس في صيغة معينة لنشر البحوث، كانت دورية «نيتشر ميثودز» Nature Methods قد تبنتها مؤخرا،
بغية مكافأة دراسات قياس الأداء المرجعية. وطبقًا لهذه الصيغة، التي تعرف باسم «بيان
الخطة البحثية الموثق» Registered Reports، يُدعى الباحثون إلى التقدم بخطتهم البحثية، قبل قيامهم بجمع
البيانات. وإذا تبين أن الخطة تستوفي متطلبات الدورية العلمية، من حيث الابتكار، ونطاق
البحث، والشمولية، يتم اعتمادها مبدئيًا بصفة مؤقتة. وبعد جمع البيانات، إذا
اجتازت الدراسة اختبارات الجودة، ونجحت في تفسير نتائجها واكتشافاتها على نحو تراه
هيئة تحرير الدورية العلمية منطقيًا، يُقبل نشر الدراسة، بغض النظر عن مضمون نتائجها.
وحول ذلك، يقول بوينروسترو: "هذه صيغة ثمينة للغاية لمجال النشر العلمي".
كذلك يستطيع الباحثون أن يجمعوا معا
على صحة معيار معين. على سبيل المثال، في عام 2019، اجتمع عشرات الباحثين المنتمين
لمعهد بحوث هيلمهولتس ميونخ، في نويَرْبيرج، بألمانيا، وجامعة لودفيج ماكسميليان
في ميونخ، في منتجع للإجازات ببلدة شليرسيه، بألمانيا. وهدفوا من تجمعهم إلى
اختبار أداء تقنيات شتى، من حيث قدرتها على دمج وقياس صحة البيانات المأخوذة من
مصادر مختلفة. وهو ما يعد في غاية الأهمية للباحثين الذين يبنون مجموعات ضخمة من
بيانات الخلايا المُفردة. وقد شَكَّل أولئك الباحثون فِرَقا، ودرسوا بيانات حقيقية،
وبياناتِ محاكاة، خاصةً بتسلسل الحمض النووي الريبي، ووفرة الكروماتين، في أكثر من
1.2 مليون خلية. ونُشِرَت أعمال هؤلاء الباحثين، بعد أن أضافوا إليها المزيد إثر
عودتهم إلى مقارهم، في ديسمبر عام 2021، أي بعد مرور أكثر من عامين على قيامهم بجمع
بياناتهم6. ويُعَدُّ ذلك زمنا طويلا، بحسابات عالم تقنيات الخلايا
المفردة الآخذ في التطور سريعًا. ففي ظل توالي ظهور التقنيات الجديدة باستمرار،
فإن فترة صلاحية أي دراسة من دراسات قياس الأداء المرجعية الخاصة بالخلايا المفردة،
لا تتجاوز بضعة أعوام.
في ذلك الصدد، يقول ماثيو ريتشي،
المتخصص في نظم المعلومات البيولوجية، من معهد وولتر وإليزا هول للبحوث الطبية، في
مدينة باركفيل الأسترالية، والذي لم يكن ضمن فريق الدراسة: "تتقادم
كل تلك البحوث سريعًا، في ظل تغير التقنيات، وتغير البروتوكولات والبرمجيات، وخطى
التطوير والتحسين لكل شيء". ويضيف: "هناك حاجة ماسة لضمان استمرارية هذه
العملية".
بيد أنه ليس من المجدي في هذا
السياق أن يُنظر لإضافة الباحثين لطريقة أو اثنتين، كتحديث لدراسات قياس الأداء المرجعية.
فقد اكتشف روبنسون، من خلال تحليله الإحصائي لاثنتين وستين دراسة3، أن
كل دراسة تنحو إلى استخدام قواعد خاصة بها، دون معايير أو منهجية. ويقول: "استخدام
هذه القواعد، ثم التوسع في استخدامها والبناء عليها، شبه مستحيل".
ولتلافي هذا القصور، يسعى روبنسون وفريقه
البحثي، إلى تصميم أنظمة جامعة، تسمح للمستخدمين – على غرار ما تسمح به منصة
«ليانا» - بأن يقارنوا بين الخوارزميات، مستخدمين طيفًا عريضًا من مجموعات البيانات
التي تخضع لمعايير ذهبية. ومن هذه الأنظمة، نظام يعرف باسم «القضايا المفتوحة في مجال
تحليل الخلايا المفردة»Open Problems in Single-Cell Analysis ، وهو يتيح "منصة
مرجعية للتحليل الآني"، بحسب وصف أحد المشاركين في تأسيس الموقع، دانيال
بوركهارت، المتخصص في تعلم الآلة، من شركة «سيلاريتي» Cellarity، التي تنتج مستحضرات
دوائية، في سمرفيل، بولاية ماساتشوستس الأمريكية. ويستطيع المستخدِمون الولوج على
هذه المنصة إلى قوائم بأفضل التقنيات، تصنِّف الطرق اعتمادًا على أدائها، عند
تجربتها على مجموعات بيانات مختلفة. وحتى الآن يوفر النظام عشر طوائف من المهام، منها
إزالة التشويش من البيانات، ودمج بيانات العينات، كما يتيح أكثر من عشر مجموعات بيانات،
وحوالي أربعين طريقة لمعالجتها. ويستخدم القائمون على النظام كل طرق التحليل، ويوفرون
الشفرة المطلوبة لها للمستخدمين إذا أرادوا تنزيلها؛ ويستطيع مبتكرو الطرق الجديدة
لتحليل البيانات إضافة الأدوات، والتعديلات والتحسينات على الشفرة، لطرح طرقهم
الخاصة. وقد سجل الموقع 25 ألف زائر جديد، منذ بدء افتتاحه في يناير من عام 2021،
بحسب ما يقول بوركهارت.
ويضيف بوركهارت: "إن دراسات
قياس الأداء المرجعية التي تُعلن على منصة مركزية، أفضل كثيرا من تلك التي تُنشر بالطريقة
التي تُنشَر بها البحوث". وهناك خيارات أخرى من هذه الأنظمة، مثل نظام «أومنيبِنْشمارك»
OmniBenchmark، الذي طوره روبنسون،
و«أوبن إي بنش» OpenEBench، التابع لمنصة تعرف باسم «إليكسير تولز» ELIXIR Tools. غير أن هذه
النظم لم تجد طريقها للانطلاق بعد؛ وينوه روبنسون إلى أن جميع دراسات قياس الأداء المرجعية
الاثنتين والستين المنشورة، التي شملها تحليله الإحصائي، لم تَستخدِم هذه النظم.
ويتوقع باحثون أن يتباطأ معدل
التطورات التي يسلكها المجال، بمرور الوقت، وأن يجمع علماء نظم المعلومات البيولوجية
على تقنيات أكثر تقاربًا في معاييرها، مثلما يحدث في الغالب مع ضروب التكنولوجيا
الجديدة.
فتقول لي كاو: "إنه سباق جنوني،
لكن بإمكان المرء أن يلحظ بالفعل أن البعض يميلون إلى استخدام الأدوات نفسها. ولا
يرجع ذلك إلى أن هذه الأدوات هي الأفضل بالضرورة، ولكن لأنها سهلة الاستخدام".
وما زال هذا الحقل البحثي بحاجة إلى بعض الوقت، قبل أن يستقر على واحدة أو أكثر،
من الاستراتيجيات الصائبة. أما في الوقت الراهن، فيمكن لدراسات قياس الأداء المرجعية،
أن تساعد على تقليل الالتباس، بالنسبة للعلماء الذين يواجهون طيفًا شاسعًا من
الخيارات، كفيل بالإصابة بالدوار.
آمبر دانس، صحفية علمية حرة، تقيم في مدينة لوس أنجلوس بولاية
كاليفورنيا الأمريكية.
doi:10.1038/nmiddleeast.2024.11
1.
Ding, J. et al. Nature Biotechnol. 38, 737–746 (2020).
2.
Mereu, E. et al. Nature Biotechnol. 38, 747–755 (2020).
3.
Sonrel, A. et al. Preprint at bioRxiv
https://doi.org/10.1101/2022.09.22.508982 (2022).
4.
Chen, H. et al. Genome Biol. 20, 241 (2019).
5.
Dimitrov, D. et al. Nature Commun. 13, 3224 (2022).
6.
Luecken, M. D. et al. Nature Methods 19, 41–50 (2022).
تواصل معنا: