fbpx

סטטוס בקרת שירות

עדכון 24.3.2024  בשעה 05:16

.עדכון סטטוס: השירותים תקינים ונגישים כעת.

אנחנו ממשיכים את הבדיקות שלנו בהתאם לתוצאות התחקור עד כה, ולכן טרם הסתיים סופית הטיפול בנושא. 

צוות משמרות יוציא סיכום מלא לנושא בימים הקרובים. יש לראות הודעת סיום טיפול מטה.

צר לנו על חוסר הנוחות שנגרם כתוצאה מהתקלה.

 

הודעת ביניים:

משתמש יקר,

ביום שבת חווינו תקלה רוחבית ולא רגילה בשירותינו.

מרגע שזוהתה, החלנו תחקור רציף ע”י צוות תחזוקת השרתים וצוות משמרות.

בסיוע אנשי התשתיות ותחקור הניטורים השונים, הבעיה אותרה ומיד התחלנו בטיפול.

לאחר עבודה מאומצת ורציפה המערכת חזרה לפעילות, וזאת לאחר שחזור הנתונים מהגיבוי של שעה 2 לפנות בוקר בשבת  (כ- 6 שעות לפני קרות הבעיה).

להלן תיאור מפורט של האירוע:

ביום שבת חווינו תקלה רוחבית וקריטית בשירותינו.

מרגע שזוהתה בעיית הגישה, החלנו תחקור ע”י צוות תחזוקת השרתים וצוות משמרות.

תחילה, נבדקו כיוונים רבים, לרבות: בעיות חומרה וסייבר – אשר נשללו.

בסיוע אנשי התשתיות ותחקור הניטורים השונים, הבעיה אותרה, ונראה כי נבעה מפגם בתהליך סנאפשוט (גיבוי) שהורץ על השרתים על ידי חברת אחזקת השרתים בחווה, ומיד התחלנו בטיפול.

חשוב לציין שהמידע במערכת משמרות מגובה ב-3 גיבויים, כאשר שניים מהם מחוץ לחווה, ואחד בחווה.

האפשרויות שעמדו בפנינו לאחר הגילוי, היו:

1. טיפול עד תיקון הבעיה

2. שחזור סביבת המידע מגיבוי לוקאלי בחווה (חזרה כ- 6 שעות אחורנית)

3. שחזור מסביבת המידע בענן (חזרה עד 10 דק אחורה) – תהליך שעשוי לקחת זמן ארוך יחסית בשל כמות המידע הגדולה.

הוחלט לבצע את הפתרונות במקביל, מתוך תפיסה שכאשר תהליך כלשהו מסתיים ראשון, איתו נתקדם למטרת העלאת המערכות. לבסוף, לאחר עבודה מאומצת ובדיקת כל החלופות, שחזרנו את הנתונים מגיבוי שרת של 2 לפנות בוקר בשבת (6 שעות לפני קרות הבעיה) כדי להחזיר את השירותים לתפקוד.

*חשוב לציין – באם הינך נדרש לגישה למידע מהלילה שבין שבת ב-2:00 לפנות בוקר לשעה 8:00 בבוקר (שבת), אנא צרו איתנו קשר כדי שנסייע לכם בהעמדת המידע.

 

 

היסטורית עדכון מתגלגל לנושא לעיל:

קיימת כרגע תקלה רוחבית בשירותים המשפיעה על מירב הסביבות.

הנושא קריטי ועומד להסתיים, אך עדיין מטופל ברגעים אלה ע”י צוות תחזוקת השרתים וצוות משמרות.

הבעיה אותרה ונמצאת בטיפול: נראה שישנה תקלה בתהליכים נמוכים אשר גורם לנפילות שרתי המידע או איטיות של העלאת תשתיות המידע של המערכת, כולל כאלו שמוקמו לצורך שרידות.

אנחנו מטפלים ברגעים אלו בתקלה – צוות תחזוקת השרתים בחווה מבצע ברגעים אלו טיפול רציף בתהליכים אלו בצורה מעמיקה, ואנחנו מצפים כי ברגע שיסתיים, אז הנושא יפתר והשירותים יחזרו. 

בקרת שירותים :

V1-V20 תקין
P1-P8 תקין
P9 תקין
P10-P20 תקין
API תקין
s1-s20.coil תקין
Missions תקין
Students תקין
Scheduled tasks תקין

 

התחל לשבץ חכם כבר היום

התחל את המהפיכה הארגונית שלך. שיבוץ חכם, פשוט ושמתאים לך בדיוק.
בקשה להצגת המערכת