כדאי להכיר – Incident Management ב- Mattermost
לאחרונה נוספה יכולת משמעותית ל- Mattermost – ניהול אירועים בתוך המערכת.
נניח וישנו אירוע חשוב המצריך התייחסות מהירה של צוות מסויים או אפילו מצריך התערבות חוצה-ארגונית של כמה צוותים (למשל תקלה משמעותית שמשביתה את השירות העסקי שאנו מציעים ללקוחותינו), אזי ניתן להגדיר תהליך עם checklist של כיצד לנהל את האירוע ("playbook"), ואם קורה האירוע ניתן להשתמש בזה כדי לנהל את האירוע נכון, ולאחר מכן ניתן גם לתחקר את האירוע כדי להשתפר לעתיד (לראות למשל מתי הגיבו, זמני תגובה ועוד). ניתן לראות זאת על ציר הזמן בהתאם לתהליך שהוגדר לניהול האירוע.
להלן הסברים נוספים, הקלטה והדגמה
לנוחיותכם צירפנו סיכום קצר ונקודות זמן בוידאו
0:00 – מבוא
- מהו אירוע (incident)
- מדוע אמור להיות לנו אכפת מזה (סיכונים, להתמקד בלקוחות , לפתור דברים מהר, לחסוף כסף וזמן)
- כיצד בונים מערכת ניהול אירועים
(בקצרה: יש להגדיר תהליך ; יש לבחור כלים ; צריך להגדיר דרכי תקשורת לטיפול (פנימה והחוצה מול לקוחות) ; יש להגדיר תיעוד / מסמכים כדי שהטיפול יהיה אפקטיבי)
12:40 התפיסה של "DevOps Command Center" – ניהול מרכזי לכל אירועי ה- DevOps
- Mattermost נועד מתלכתחילה להיות כלי מרכזי לניהול ה DEVOPS ו הPROD .
- הזכיר כלים אחרים שיכולים להיות מותאמים ל- DevOps בדיעבד: PagerDuty , VictorOps. וגם OpsGenie
- ניתן לחבר את Mattermost מוולם כאינטגרציה.
- ניתן גם לחבר מול Jira למשל.
18:00 – הדגמה כיצד זה עובד
- הגדרת תהליך ו- playbook
- ניהול אירוע וכו'