אינטליגנציית DevOps
אל תקראו לוגים. שאלו אותם.
RCA מבוסס RCA על כל ה-stack: K8s, AWS, GCP, Datadog. שורש בעיה בשפה טבעית.
Datadog מראה לכם מה נשבר. הוא לא אומר למה.
תקלה. אתם קופצים בין Datadog, CloudWatch, Loki, Grafana, GitHub, לוג ה-deploy, ושרשור סלאק משבוע שעבר. 20 דקות אחר כך יש לכם תיאוריה. Ops Intelligence עונה ב-30 שניות, בשפה ברורה, עם הראיות מקושרות.
איך זה עובד
- 01חברו את stack התצפיתיות
Datadog, CloudWatch, Prometheus, Loki, Grafana, Sentry — מפתחות API לקריאה בלבד.
- 02שאלו בשפה טבעית
"למה זמן תגובה של checkout קפץ ב-14:32?" ה-AI בונה שאילתת RAG מעל לוגים, מטריקות ו-traces.
- 03קבלו תשובה עם מקורות
השערת שורש בעיה עם קישורים ל-לוגים, ל-deploy diff, ופתרון מומלץ.
יכולות
לוגים, מטריקות, traces, היסטוריית deploys, runbook, וסלאק של תקלות — שאילתה אחת.
ציר זמן אוטומטי: deploys, התראות, פעולות ידניות, הכל בתצוגה אחת.
מבוסס פתרונות עבר ב-repo שלכם, ה-AI מציע שינוי קוד או config.
מייצר טיוטה ראשונה של post-mortem מציר הזמן. עורכים ושולחים.
מבין את ה-error budget שלכם ואומר אם חקירה יכולה לחכות לשעות העבודה.
לא ידפוק את ה-API של Datadog. cache ו-dedup. חזות עלות שאילתה לפני הרצה.
מקרי שימוש
"מה השתנה ב-30 דקות האחרונות?" תשובה ב-shot אחד עם ה-deploy diff ששבר.
"3 שורשי הבעיה המובילים ברבעון, מקובצים לפי שירות." מיוצר כגרף מוכן-שקופית.
שואל "מה עושה שירות התשלומים?" ומקבל תשובה מעודכנת, מבוססת-קוד — לא wiki מיושנת.