ערכת כלים גרפית להצגה של נתוני גנום

לעולם הגנומיקה אין מחסור בכלי הדמיה. אבל ככל ששיטות וסוגי נתונים חדשים צצים, טכניקות קיימות יכולות להתקשה להתמודד. כעת, כלי המכונה Gosling מאפשר לביואינפורמטיקאים לבנות אפליקציות שיכולות להציג מידע גנומי באותה רמת גמישות שמפתחים למדו לצפות מכלי תכנות גרפיקה אחרים.

שוחרר לראשונה בשנת 2020 על ידי הביואינפורמטיקאי נילס גהלנבורג וצוותו בבית הספר לרפואה של הרווארד בבוסטון, מסצ’וסטס, גוסלינג מייצג “דקדוק של גרפיקת נוקלאוטידים אינטראקטיבית מדרגית”.1. אבל השם הוא גם קריצה לביולוג המבני ריימונד גוסלינג, אשר, יחד עם רוזלינד פרנקלין, לכד את ‘תמונה 51’ המפורסם, שחשף את מבנה ה-DNA.

גוסלינג הוא מה שמכונה דקדוק. הוא מיושם בספריות תכנות המספקות תחביר גמיש לתיאור אזורים ואינטראקציות גנומיות וכיצד יש לפרוס אותם בדף אינטרנט. חוקרים וביואינפורמטיקה יכולים להשתמש בספריות אלה כדי ליצור הדמיות אינטראקטיביות וניתנות להרחבה שהם יכולים לחלוק עם עמיתיהם, ולבנות כלים מותאמים אישית לניתוח גנטי.

ניתן לקשר את התצוגות שגוסלינג יוצר, כך שבחירה של אזור בחלונית אחת מדגישה את אותו אזור באחר. ניתן גם לסובב אותם, לתפעל אותם ולהתקרב ולהוציא אותם מרמת הכרומוזום עד לנוקלאוטידים בודדים. “הייצוג החזותי מסתגל לרמת הזום”, אומר גהלנבורג – תכונה הנקראת זום סמנטי. סביבת בדיקה מקוונת מספקת הדמיות שמשתמשים יכולים להרחיב כדי ליצור ולייצא גרפיקה משלהם. וספריות עבור Python (Gos) ו-JavaScript (gosling.js) מאפשרות לביואינפורמטיקה לתכנת את התמונות ישירות למחברות חישוביות של Jupyter ויישומים אחרים. גרסת אלפא שלב R שוחררה ביולי. הספריות משמשות לקשר שיטתי של מערכי נתונים להדמיה שלהן, אומרת תמרה מונזנר, מדענית מחשבים באוניברסיטת קולומביה הבריטית בוונקובר, קנדה. ספריות פופולריות כגון ggplot2 ו-Vega-Lite משתמשות ב’דקדוק של גרפיקה’ כדי להגדיר את ההדמיה שלהן. אבל הכלים האלה יכולים לשמש עבור כל סוג של גרפיקה, בעוד Gosling תוכנן במיוחד עבור הדמיות גנומיקה. “זה כמו וגה-לייט לגנומיקה”, אומר מונצנר.

מגשר על הפער

כלי תכנות להדמיות נע בין פונקציות מבוססות תבניות המשתמשות בשורה אחת של קוד ליצירת גרף מסוג סטנדרטי ועד לאלו המרכיבות הדמיות חלק אחר חלק מקווים וצורות גיאומטריות, כגון ספריית JavaScript D3.js. גרסת התבנית קלה לשימוש, אך יחסית לא גמישה; השני מציע הרבה יותר התאמה אישית, אבל הוא מייגע לשימוש.

“גוסלינג באמת מגשר על הפער הזה, מה שמקל על הכנת כלים חדשים שיש להם רכיבי הדמיה”, אומרת מריה נאטסטאד, מהנדסת תוכנה בגוגל במאונטיין וויו, קליפורניה. כחלק ממחקר הדוקטורט שלה ב-2015, Nattestad פיתחה כלי בשם SplitThreader, המציג את הגנום בפריסה מעגלית המכונה עלילת Circos, עם קריאות רצף כקשתות כדי להדגיש וריאציות מבניות. ללא אפשרויות אחרות, היא ציירה את האלמנטים האלה מאפס, תוך שימוש ב-D3.js כדי לציין את המיקום והמידות של כל קו, מלבן ומעגל. “זו הייתה עקומת למידה כזו”, היא אומרת. “לקח לי הרבה זמן לבנות את SplitThreader”, היא אומרת, אבל מוסיפה שהוא כנראה יכול היה לבנות הרבה יותר מהר עם Gosling.

גהלנבורג אומר שגוסלינג צמח מתוך סקירת ספרות משנת 20192, במהלכו סקר הצוות שלו את נוף הדמיית הגנום ובנה טקסונומיה לכלים וליכולות שלהם. משם, החוקרים פיתחו תחביר כדי לתאר באופן שיטתי את ההדמיות שהכלים האלה יכולים לעשות. גוסלינג, מסביר גהלנבורג, “היא גישה בסיסית להרכבת הדמיות גנומיות באמצעות אותה טקסונומיה”.

Gosling מקודד את הנתונים באמצעות פורמט טקסט פשוט הנקרא JavaScript Object Notation (JSON) ומשתמש בשפה הספציפית לגנומיקה כדי להשלים את המונחים הכלליים יותר המשמשים בספריות גרפים סטנדרטיות. Gosling.js, Gos ו-g(R)osling משתמשים בקידוד הזה כדי ליצור קבצים בשפות התכנות שלהם. ההדמיה הסופית מצוירת בדפדפן אינטרנט באמצעות מנוע רינדור וכלי עיצוב קבצים שפותחו על ידי צוות Gehlenborg כדי להמחיש נתונים כרומוזומליים מטכניקה הנקראת Hi-C3. הדמיות ב-gosling-lang.org מספקות נקודות התחלה למזימות Circos, ביאור גנים, מפות חום של קונפורמציה של כרומטין, שימור אבולוציוני ועוד.

הפוסט-דוקטורט Sehi L’Yi, שהוביל את הפיתוח של גוסלינג, אומר שמה שמבדיל את גוסלינג מכלי הדמיה אחרים הוא כושר הביטוי שלו. עם רוב הכלים, הוא אומר, הגרפיקה שניתן ליצור ואיך הם ייראו מוגדרים מראש. “זה ממש לא קל להתאים אישית הדמיות כמשתמש.” אבל עם Gosling, המשתמשים יכולים, למשל, לציין את הצבע, הממדים והמיקום של הסמל המשמש לייצוג צנטרומר או מרווח גנומי, ואז לכסות זאת על אידיאוגרמה של כרומוזום כדי להדגיש אזור של עניין.

חלל מעניין

צוות של סטודנטים לתואר שני באוניברסיטת קולומביה הבריטית החליט להשתמש בגוסלינג כדי ליצור את פרויקט הגמר שלו בשיעור הדחת נתונים. “אחד מחבריי לצוות שמע על זה בכנס בשנה שעברה”, אומרת חברת הצוות ארמיטה סאפא. “אפילו למי שאין לו רקע קידוד, קל יחסית לעבוד עם גוסלינג מאשר רוב הדברים האחרים המשמשים להדמיה”, היא אומרת. עם זאת, היא מציינת שבתחילה הם התקשו לחלץ את הנתונים הדרושים להם כדי לאפשר למשתמשים ללחוץ על אזורים וליצור הדמיות חדשות.

דומיניק ג’ירארדי, מנהל מוצר ראשי בחברת הדמיית נתונים Datavisyn בלינץ, אוסטריה, התנסה גם הוא עם Gosling כדי ליצור מגרש משחקים אינטראקטיבי המאפשר למשתמשים לסנן טבלת גנים לפי אזור גנומי. החברה – ש-Gehlenborg שותפה לייסד – משתמשת כעת בגוסלינג כדי ליצור כלי ויזואליזציה עבור לקוחותיה הארגוניים, למרות שעדיין לא השלימה אחד, אומר ג’ירארדי.

גוסלינג היא לא ספריית ההדמיה היחידה לנתונים גנומיים; דוגמאות אחרות כוללות ggbio, gggenomes ו-gggenes, כולם הרחבות של ספריית הגרפים ggplot2. אבל רוב הכלים האלה יוצרים תמונות סטטיות, אומר גהלנבורג – תמונות, ולא הדמיות אינטראקטיביות. Gehlenborg אומר כי התוכניות העתידיות עבור Gosling כוללות מתן ממשק גרפי, כך שחוקרים יכולים ליצור הדמיות על ידי גרירה ושחרור של ווידג’טים על בד וירטואלי במקום צורך לתכנת אותם.

רוברט Buels, המוביל פיתוח של דפדפן גנום באוניברסיטת קליפורניה, ברקלי, אומר שגוסלינג “תופס מקום מעניין באמת” בארגז הכלים להדמיה של גנומיקה. “תוכל לקבל הרבה יותר התאמה אישית עם Gosling”, הוא אומר. אבל המשתמשים לא צריכים לכתוב כמעט הרבה קוד כמו שהם עושים עבור כלים כגון D3.js.

“זו נישה ממש מעניינת בין שני הדברים”, הוא אומר, “שלדעתי היא תוספת ממש נהדרת לתחום”.

Leave a Comment