בערוץ
 
 
 
 
 
 
 
 
טכנולוגיות חדשות יאפשרו אחזקת בסיסי נתונים גדולים במיוחד 

טכנולוגיות חדשות יאפשרו אחזקת בסיסי נתונים גדולים במיוחד

 
 
אבי בליזובסקי, מערכת

כמויות הנתונים הצפויות להתקבל בעשור הקרוב כתוצאה מחקר החלל הן עצומות; לשם כך משתמשים מכוני המחקר השונים באחסון מידע "מונחה עצמים" המאפשר חלוקה ושמירה של המידע על פי סיווגים

 
 
 
 
 
 
 
 
 
פרוייקט SDSS - The Sloan Digital Sky Survey, שנועד למיפוי תלת מימדי של פיזור הגלקסיות בחלל, שיחרר לאחרונה בסיס נתונים "מפלצתי" (בגודלו), הכולל 50,000 גלקסיות ו- 500 קוואזרים (גפים שמימיים מאסיביים).
 

בסיס הנתונים שנוצר, כולל 500 גיגה בייט אשר פתוחים לכל, לצורכי מחקר. בתקופה חמשת שנות המחקר, הכוונה היא למפות 10000 קוואזרים. על כך דווח בשבוע שעבר בכנס החברה האסטרונומית האמריקאית בפסדנה. בסופו של דבר הכוונה היא להגיע ל-40 טרה-בייט של נתונים.

כמויות הנתונים הצפויות להתקבל בעשור הקרוב הן עצומות, בין היתר כתוצאה מניסויים מתוכננים במאיץ החלקיקים החדש LHC- Large Hadron Collider, שאמור להתחיל בפעולה בשנת 2005 בסרן שליד ז`נווה.

"הנתונים החדשים יכתבו על דיסק, בקצב של 100 מגה בייט לשניה", אומר ג`וליאן בון Julian Bunn מהמרכז לחקר המיחשוב במכון הטכנולוגי של קליפורניה (קאלטק), "אנחנו צופים שניסויים אלו יפעלו במשך 10-15 שנים, פירוש הדבר צבירת נתונים של 100 פטה-בייט או בערך 10 מיליון דיסקים קשיחים של מחשבים אישיים בימנו (פטהבייט פירושו עשר בחזקת 15 של בתים).

ארגון הנתונים והפיכתם לזמינים לקהילת המדענים הבינלאומית, בלא לגרום לקריסת מחשבים או רשתות, תדרוש חשיבה מחודשת של הדרכים בהם מאוחסנים ומופצים הנתונים. מומחים במכונים שונים, בינהם ג`ונס הופקינס, המאיץ הלאומי על שם פרמי (פרמילאב), קלאטק וחברת מיקרוסופט, בוחנים בדיוק את הנקודה הזאת. באמצעות הצפת מערכות מחשבים בנתונים וארגונם מחדש, הם מקווים להניע גישה אוניברסלית לארכיון הנתונים המלא. "רמת מורכבות המידע היא חסרת תקדים", אומר פיסיקאי החלקיקים מקלאטק, הארווי ניומן. "אנחנו זקוקים למאמץ משותף בינלאומי כדי להשיג את יכולת המיחשוב".

סלאי ועמיתיו מג`ונס הופקינס, קאלטק ופרמילב מנסים לטפל כעת בשלב הראשון: ארגון בסיס הנתונים כדי להקל על החיפוש בהם. בסיסי הנתונים המדעיים מאחסנים את המידע בצורה סדרתית, לפי הסדר שבו התקבלו בניסוי, "דבר זה הופך חיפוש של תתי סיווגים כמו למשל כל הגלקסיות הכחולות בסקר השמים, לאיטי מאוד", אומר סלאי. "אנחנו צריכים לחלק את המידע ולכבוש אותו בחלקים" אומר סלאי.

הצוות שלו תכנן תוכנה לסקר השמים שתסווג את הכוכבים והגלקסיות בכל תמונה בסקר שיתבצע באמצעות טלסקופים בניו מקסיקו, ותאחסן נתונים אלו במעין "דליים" המכונים עצמים. תוויות אלקרוניות כמו "גלקסיות כחולות" או "כוכבים בעלי בהירות 11" תסמן את תוכן הדלי, ותוכנת בסיס הנתונים תקשר כל אחד מהדליים לדלי אחר בצורה הקרויה "בסיס נתונים מונחה עצמים". ברז הנתונים עדיין פתוח והתוכנה של סלאי עובדת קשה כדי להפיץ את המידע לדליים הנכונים.

מיון הנתונים לפני אחסונם יפחית באופן דרמתי את זמן המחשב הדרוש למציאת מידע חיוני. "זה כמו ההבדל במציאת שיר בקלטת לעומת מציאת שיר בתקליטור", אומר הפיסיקאי, ברוס אלן.

* באדיבות אתר "הידען".
 
 
 
@@@@@@@@@@@@@@@@@@@ ilan @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
 
@@@@@@@@@@@@@@@@@@@ ilan @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
 
 

כל הזכויות שמורות 2011 © נענע 10 בע"מ
 
 
 
 
כל הזכויות שמורות © Nana10 בע"מ
Video powered by