משטרת לונדון התעוררה לבוקר מסויט.
זו הייתה פריצה מתוחכמת ביותר ל"טייט מודרן ארט", מוזיאון האמנות הנחשב. הפורץ נכנס, גנב ציור בשווי של עשרות מיליוני פאונד ויצא מבלי להשאיר ולו סימן אחד בלבד. לא טביעת אצבעות, לא צילומים ממערכת האבטחה, לא DNA, לא עקבות נעליים, שום כלום.
בשנת 2015 סיפור כזה היה מעסיק צוות חקירה ענק שמונה עשרות בלשים, חוקרים ואנשי זיהוי פלילי. מאות אנשים היו נאלצים לעבור תשאול ברחבי הבירה האנגלית וימים רבים היו עוברים בליקוט סיזיפי של מידע ממקורות מידע שונים ומשונים. הסיכוי לעלות על עקבותיו של השודד היו הולכים ופוחתים ככל שהזמן עובר.
ובכן, בעוד כמה שנים, לפחות לפי "סאפ", ענקית התוכנה הגדולה באירופה, לא יהיה צורך בכל האופרציה הזו. כל מה שנצטרך זה להדליק את המחשב ולתת לו לעבוד, בזמן קצר ביותר נגיע לרשימת חשודים מתומצתת. איך הפלא הזה קורה? בזכות מיליארדי נתונים שמוצלבים ברגע אחד, כל פרט מהקטן ועד הגדול נסרק בשניות, כל מי שהיה אי פעם חשוד בשוד אמנות נכנס למאגר, כל הטיסות ללונדון ומחוצה לה נבדקות, כל שימוש באשראי ולמעשה כל מידע שקשור או כזה שנראה על פניו לא קשור לסיפור נכנס לסלט שנקרא ביג דאטה (ראו בסוף).
נחשפתי למערכת הזו בביקורי במטה חברת "סאפ" בלונדון במסגרת סיור עיתונאים מכל העולם. הסיטואציה הבלשית-בדיונית הייתה דומה להפליא לסרט של טום קרוז "דו"ח מיוחד", שם הוא רודף אחרי פושעים עוד לפני שהם ביצעו את פשעם בזכות מאגרי מידע בלתי נדלים שהיו לרשותו. גם כאן, מול מסכי ענק ועל גבי שולחנות טאץ' סקרין בוהקים המערכת סיפקה לנו רשימת חשודים ממוקדת בתוך שניות. זה היה מרשים, עתידני, כמעט בלתי נתפס ויחד עם זאת מוחשי להחריד.
בקרוב זה יקרה, למעשה בצורה כזו או אחרת זה כבר קורה בתחומים שונים מספורט, מסחר, תעשייה ובעצם כל דבר בעולם הטכנולוגי של היום. נותנים גז "עד עכשיו היה לנו כל המידע, אבל לא היה לנו מושג איך להשתמש בו", אמר אוליבר בירהוף, מנג'ר נבחרת הכדורגל של גרמניה, אלופת העולם, במסיבת עיתונאים לפני תחילת המונדיאל.
"היום אנחנו יודעים איך לטפל בזה, אנחנו משתמשים במידע ובכלים שקיבלנו כדי לשפר את השחקנים וזה עובד, יש לנו כל המידע מהשחקנים ומהיריבים שלנו והכדורגלנים שלנו מבינים את המידע וזה עוזר להם במגרש".
"סאפ" אימצה את נבחרת גרמניה ואת קבוצת הכדורגל באיירן מינכן ומספקת להן שירותי מידע שהופכים את המכונה הגרמנית היעילה ליעילה הרבה יותר. המערכות של "סאפ" יודעות לנתח למעשה כל נתון במגרש בעזרת עשרות מצלמות ומיליוני נתונים שמעבדים תמונת מצב מדויקת למנג'ר. ניתן להתמקד בכל שחקן בנפרד, בקבוצה או ביריבים. המערכת מנתחת הכל: ממספר הקילומטרים שהשחקן רץ, מיקומו בכל רגע נתון במשחק, כמות המסירות המדויקות ועוד ועוד. אם פעם מנג'ר היה מסתפק בפנקס ושידור חוזר של המשחק, היום הוא יכול לנתח בזמן אמת ואחרי המשחק מה באמת קרה שם, למה צריך להזיז את סבסטיאן שווינשטייגר עוד מטר קדימה כי זה מה שיעלה את התפוקה שלו בחמישה אחוזים.
הנבחרת הגרמנית אולי לא לקחה את אליפות העולם בזכות הניתוח של "סאפ", אבל אין ספק שהייתה לכך השפעה מכרעת על תפקוד הנבחרת ועל הטקטיקה. מהניתוח הפנומנלי של הנבחרת הגרמנית עברנו לעוד תחום שבו הביג-דאטה משפיע מאוד בתחום הספורט.
בתחום הפורמולה 1, שבו ניצחון יכול להיות בהפרש כה זעום, למערכת יש חשיבות מכרעת. חדשנות תחילה "סאפ" היא חברת התוכנה הרביעית בגודלה בעולם, בעלת הכנסות של 20 מיליארד דולר בשנה ושווי שוק של 104 מיליארד. היא מעסיקה 67 אלף עובדים ב-130 מדינות. בישראל יש ל"סאפ" מעל ל-3,000 לקוחות שמשתמשים בפתרונות החברה לניהול בתי עסק. החברה מעסיקה בישראל 700 עובדים במרכז מכירות ויש לה מרכז פיתוח גדול ברעננה.
בכלכלה של ימינו, המושתתת על נתונים, עסקים מכל התחומים רותמים ניתוחי ביג דאטה כדי להתמודד עם הלחצים הכלכליים שניצבים לפניהם. חברת "ג'ון דיר", לדוגמה, היא אחת מיצרניות המיכון החקלאי הגדולות בעולם, לרבות קומביינים וטרקטורים. החברה עשתה שימוש בניתוח נתונים כדי להמציא את עצמה מחדש וציידה את המיכון שלה בחיישני SAP HANA שאוספים נתונים על מזג אוויר כדי לאפשר לחקלאים לקבל החלטות מושכלות יותר על עיתוי זריעת הגידולים שלהם.
החברה משתמשת בניתוח נתונים נוספים גם כדי להגן על המיכון מפני קלקולים על ידי ניבוי הזמן הממוצע לכשלים. לעתים קרובות לחקלאי יש חלון הזדמנויות של ימים ספורים כדי לזרוע גידולים – ואם הכלי שלו מתקלקל בדיוק אז, העסק שלו ייפגע כתוצאה מאובדן הכנסות.
בשירותים פיננסיים, ביג דאטה משחררים את העסקים מאילוצים מגבילים של צבירת נתונים ומאפשרים ניתוח נתונים פשוט יותר וקבלת תובנות משמעותיות יותר. בקמעונאות, ביג דאטה הם צורך וגם יתרון אסטרטגי. לניתוח נתונים תפקיד מכריע בשלוש רמות: מיקום חנות, אסטרטגיית מבחר מוצרים וקשר עם לקוח. קחו למשל חנות בגדים בשדה תעופה. הודות לביג דאטה, מיקום החנות אינו מקרי – היא ממוקמת קרוב לשער שיש בו שיעור גבוה של נוסעים אמידים, כדי למקסם מכירות.
שנית, החנות נעזרת בנתונים כדי לבחור את המוצרים הנמכרים בה על סמך סוג הקונים שנכנסים בשעריה בתקופות שונות של השנה – למשל, לוודא שהחנות תצטייד בחולצות לילדים במהלך חופשות בית הספר. במישור מעמיק יותר, החנות נעזרת בנתונים על לקוחותיה ועל המא לאי שלה כדי למכור ביתר יעילות, לרבות המלצות המבוססות על מה שהלקוח רכש בביקורו האחרון, או אפילו על מזג האוויר ביעד הנסיעה שלו.
הפופולריות של רכישות מקוונות פירושה שהלקוחות מקבלים המלצות על סמך רכישותיהם הקודמות, ומקבלים הנחות בזכות הנאמנות שלהם. בעתיד הקרוב גם נראה מכונות שתייה חכמות שישתמשו בטכנולוגיה של "סאפ" כדי לחזות בכל מקום מתי ייגמרו המשקאות, מה צריך להזמין מבעוד מועד ומאיפה הכי כדאי לעשות זאת.
תחום נוסף שבו הביג דאטה והשימוש המושכל בו יעיל הוא לוחמת הסייבר. עד לפני מספר שנים לא הייתה טכנולוגיה שתתמודד עם כמויות אדירות של מידע ונתוני מודיעין ממקורות שונים. שמוליק סיטון מ"סאפ" ישראל מסביר כיצד זה עובד: שם המשחק הוא מניעה מבעוד מועד. בשנתיים האחרונות הגיעו לפריצת דרך טכנולוגית המאפשרת לארגון או למדינה להגן באופן טוב יותר על הנכסים האלקטרוניים בזכות טכנולוגית In Memory Computing.
לפי גישה זו, כל המידע מאוכלס בזיכרון של המחשב בצורה דחוסה ועל כן הוא תמיד זמין לניתוח וניטור, ללא מגבלה של מקום או נפח נתונים ובביצועים גבוהים במיוחד. על ידי זיהוי מאפיינים המסמנים את התוקף ניתן לזהות בזמן אמת ניסיון תקיפה ולמנוע אותו על ידי הכנסתו לרשימה שחורה.
רכיב נוסף הוא שימוש במידע קיים (היסטורי) המצוי במאגרי החברה ותחקורו בזמן אמת. בעת אירוע המזוהה כניסיון חבלה ניתן, בזמן אמת, לרוץ ולנתח את ההיסטוריה כדי לנסות ולקבוע את הפרופיל ההתנהגותי של התוקף, לזהות ולסווג אותו כמי שעלול לבצע חבלה. פעולה זו מאפשרת יכולת נוספת שהיא פעולת חיזוי שבעזרתה הארגון יוכל לחזות התנהגות וללמוד את אופי החבלה ומשמעותה לפני שהיא מתרחשת".
על מנת לטפל במאגרי מידע הכוללים נתונים רבים ממקורות שונים ושאינם מאורגנים לפי שיטה או פורמט כלשהו, יש לקחת מספר אלמנטים בחשבון: מסדי הנתונים אינם בנויים לאחסון ולניתוח כמויות מידע כה גדולות, כיוון שמצד אחד עלות אמצעי האחסון נמצאת בירידה, ומצד שני, כמות המידע שמגיעה מאתרי אינטרנט, רשתות חברתיות, טלפונים חכמים, מצלמות אבטחה, סנסורים ועוד, היא בלתי מוגבלת. היכולת לחבר בין הנתונים ולהשתמש בהם באופן מיטבי היא הביג דאטה.