גיבוי הוא יצירת עותקים של מידע כדי לשחזר אותו במקרה שאבד או הושחת. הגיבוי נועד בעיקר לשתי מטרות: התאוששות מאסון (שחזור אחרי תקלה גדולה) ושחזור קבצים שנמחקו בטעות.
מערכת גיבוי מחזיקה לפחות עותק אחד של הנתונים. לכן מנהלים את שטח האחסון והשיטות לחסוך מקום ולשפר ביצועים. תדירות הגיבויים נקבעת לפי חשיבות השינויים בזמן ובכמות המשאבים הזמינים.
כל אסטרטגיית גיבוי צריכה מודל אחסון. השיטה שבה מסדרים את הגיבויים יכולה להיות פשוטה או מתוחכמת, מקטלוג ידני ועד מערכת מסדי נתונים.
דגשים של מודלים נפוצים:
- גיבוי מלא + גיבוי מצטבר (incremental), עושים גיבוי מלא פעם אחת ואז גיבויים שמכילים רק מה שנשנה. לשחזור צריך את הגיבוי המלא ואת כל המצטברים אחריו.
- גיבוי מלא + גיבוי שינויים (differential), אחרי הגיבוי המלא מגבים את כל השינויים מאז הגיבוי המלא. לשחזור צריך רק את המלא ואת הגיבוי השינוי האחרון.
- שיקוף + הוראות חזרה, שומרים את המידע האחרון יחד עם הוראות כיצד לחזור לגרסאות קודמות.
- הגנה רציפה על הנתונים (Continuous Data Protection), רושמים כל שינוי ברמה נמוכה, כך שאפשר לחזור לנקודה מדוייקת בזמן.
המדיה שבה שומרים גיבויים משפיעה על מהירות הגישה, עלות וניידות:
- סרט מגנטי: מדיה ישנה וזולה יחסית, גישה סדרתית אך קצב העברת נתונים יכול להיות גבוה.
- דיסק קשיח: זמן גישה קצר, נוח לשימוש ונפוץ כיום.
- דיסק אופטי (כמו תקליטור): זול ונוח לארכוב כי רבים כותבים פעם אחת בלבד.
- התקני מצב מוצק (כרטיסי זיכרון ו־USB): ניידים אך יקרים ביחס לנפח.
- שירות גיבוי מרוחק (ענן): מגבה דרך הרשת ומגן מפני אסון מקומי. החסרונות הם מהירות תלויה ברוחב הפס וסיכון חשיפה אם לא מוצפן.
יש לאזן בין נגישות, אבטחה ועלות:
- מקוון (online): נגיש ומהיר לשחזור, אך יקר ופגיע למחיקה.
- near line: פחות נגיש, בדרך כלל אמצעי עם פעולת מכניקה כמו ספריית קלטות.
- לא מקוון (offline): דורש פעולה ידנית כדי להחזיר את המדיה.
- גיבוי מחוץ לאתר ואתר גיבוי/מרכז התאוששות: מגנים מפני אסונות מקומיים אבל יקרים.
בחירת מה לגבות היא פשרה בין חיסכון במקום לבין סיכון לאיבוד מידע חשוב. שיטות אופייניות:
- העתקת קבצים או גיבוי מערכת קבצים (כולל גיבוי מחיצות).
- זיהוי קבצים או בלוקים שהשתנו כדי לגבות רק את השינויים.
- צילום תמונת מצב (Snapshot): שומר תמונה של המערכת בנקודת זמן מסויימת.
- גיבוי חם/קר של מסדי נתונים: בגיבוי קר המסד סגור; בגיבוי חם המערכת פעילה אבל יש יומן שינויים להשלים את השחזור.
שחזור מלא דורש גם מידע שאינו קובץ רגיל: תיאור מערכת, סקטור אתחול, טבלאות מחיצות והרשאות קבצים. הכל צריך להישמר כדי לחזור למצב המקורי.
לעיתים מבצעים שינויים בנתונים לפני הגיבוי כדי לייעל את התהליך:
- כיווץ (הקטנת גודל הקבצים).
- ביטול כפילות (deduplication), שמירת עותק אחד של נתונים שחוזרים על עצמם.
- שכפול לעותק נוסף.
- הצפנה של הגיבוי כדי להגן עליו אם המדיה אבודה.
- Staging, גיבוי תחילה לדיסק זמני לפני העברה ליעד הסופי.
גיבוי הוא תהליך מתמשך. מטרות חשובות הן:
- נקודת שחזור רצויה (RPO), כמה עדכנית הכתובת לשחזור.
- משך השחזור (RTO), כמה זמן לוקח לחזור לפעילות.
יש גם מגבלות: השפעה על המערכת בזמן הגיבוי, עלויות חומרה ותוכנה, ועומסי רשת.
תזמון אוטומטי של גיבויים מקטין תלות באנוש. חשוב לבדוק ולעדכן שהגיבויים אכן תקינים. אימות יכול להתבצע בעזרת checksum או hash, בדיקה שמוודאת שהגיבוי לא נפגם. ניטור ודיווח מסייעים לזהות שגיאות ולשמור היסטוריה של פעולות הגיבוי.
גיבוי זה להכין עותק של המידע. העותק עוזר להשיב את המידע אם הוא נעלם בטעות או נשבר.
יש דרכים שונות לשמור גיבויים. אפשר לעשות גיבוי מלא של כל הקבצים.
אפשר גם לגבות רק את מה ששונה מאז הגיבוי האחרון. כך חוסכים מקום.
יש שיטה שמרשמת כל שינוי קטן. אפשר לחזור בדיוק לנקודה בזמן.
מדיות שמאחסנות גיבויים:
- סרט מגנטי: פתרון ישן וזול.
- דיסק קשיח: מהיר ונפוץ.
- דיסק אופטי (CD): מתאים לארכוב כי קשה למחוק ממנו.
- התקן USB: נייד וקל לשימוש.
- שירות גיבוי מרוחק (ענן): שולחים קבצים דרך האינטרנט למקום אחר.
לא תמיד מגבים הכל. בוחרים מה חשוב. אפשר לצלם "תמונת מצב" (Snapshot), תמונה של המחשב ברגע מסוים.
בקבצים גדולים צריך לשמור שהגיבוי יציב כדי שלא יחסר משהו.
לפעמים מקטינים את הקבצים כדי לחסוך מקום. זו דחיסה.
אם יש קבצים זהים, שומרים רק עותק אחד. זו ביטול כפילות.
כדי לשמור על סודיות מצפינים את הגיבוי (מסתירים את התוכן).
מחשבים קובעים מתי לגבות אוטומטית. צריך גם לבדוק שהגיבוי תקין.
שומרים רשומות ודוחות כדי לדעת אם משהו נכשל.
תגובות גולשים