"ביפ מי אפ, דאטה" – עוד מחשבות על דאטה וניהול

לפני כמה ימים קראתי את הפוסט – דת הדאטה – איך הרסו הנתונים את האינסטינקט הניהולי, של כנרת רוזנבלום. זה היה יופי של פוסט – קריא, מעניין, מחכים, מעורר מחשבה והיי, אפילו נתון אחד לא היה בו. אני לא יודע מה זה מוכיח, אבל זו בהחלט דוגמה לכך שעל מנת לעורר אנשים למחשבה ולפעולה, לאו דווקא צריך נתונים. ואולי ההפך הוא הנכון? טלי שרוט בספרה-"מה זה משנה" הראתה בנתונים, שמה שמשפיע על התנהגות של אנשים זה ממש לא נתונים (למזלה היא גם שילבה כמה סיפורים ברקע אחרת לגמרי זה היה ספר פרדוכסלי). וזה לא מקרי שטרנד הסטוריטלינג לא קמל ונובל אלא צומח ופורח ביחד עם טרנד (דת) הדאטה כי נתונים צריכים סיפור, ואילו הפוך – לאו דווקא.

זכור לי דיון מרתק במיוחד בו הצגנו הצעה לתהליך ארגוני למנהל הארגון, הראינו נתונים, השוואות, בנצ'מרקינג לארגונים מתקדמים אחרים – היינו על גג העולם, כל הנתונים היו איתנו. ואז הוא סיכם ואמר "הכל נכון, רק צריך לזכור שהארגון שלנו שונה".  והוא צדק, את השוני של הארגון לא סיפרנו, אין לזה גם נתון. תרבות לא רק אוכלת אסטרטגיה לארוחת בוקר, היא גם אוכלת נתונים לארוחת עשר וזה אפילו לא מדגדג לה את הבטן. בגלל זה, כל פעם שאני קורא הצהרה של מנכ"ל שאומר שכששני מועמדים זהים מגיעים אליו הוא מקדם את האישה/עולה חדש/חרדי/קבוצת מיעוט אחרת, אני מתמלא ספקות – כי נער הייתי וגם בגרתי ואפילו היום אני דוד לתאומות זהות – ועדיין לא ראיתי שני אנשים זהים. יש החלטות שאינן על בסיס נתונים, או יותר נכון, לא על בסיס הנתונים הקיימים.

יובל נוח הררי מתאר שני סוגים של מערכות מורכבות: מערכות מורכבות מסדר ראשון – מערכות שמושפעות מהרבה מאוד משתנים אבל בסה"כ בהינתן מספיק נתונים ויכולת חישוב הן ניתנות לניבוי – מזג האוויר הוא דוגמה טובה לכך, Climacell לדוגמה, עוסקת במורכבות הזו, חיזוי תופעות אקלימיות ברמת דיוק של עשרות מטרים – כי לא מספיק לדעת אם יש עננות מעל מרכז הארץ, מה שחשוב לדעת היא מה העננות בדיוק מעל מסלול ההמראה של בן גוריון. (שדה התעופה, לא האיש). הסוג השני של מערכות מורכבות הוא מערכות מורכבות מסדר שני – אלו מערכות שלא רק שהן מושפעות מהרבה מאוד משתנים הן מושפעות מהניבוי לגביהן מה שהופך אותן ל- או בלתי ניתנות לניבוי או משחזרות את הניבוי של עצמן בצורה מובהקת. נניח אם באופן תיאורטי היינו מסוגלים לנבא (כמובן על פי הנתונים שלנו היום) איזה טירון בצבא יהיה מג"ד – מיד היינו שולחים אותו לקורסים הכי מתקדמים, נותנים לו את המעטפת הכי טובה שיש וכן הלאה. מה עשינו בזה? הצדקנו את הניבוי של עצמנו. דוגמה אחרת שמתכתבת עם הפוסט היא שוק המניות – ברור לגמרי שאם למישהו הייתה מערכת מוכחת שיודעת לנבא מה קורה בשוק המניות בשבוע הבא – היא מיד הייתה משפיעה על התנהגות השוק ואז הופכת להיות מיותרת. יש פרק שלם ב"קוד סמוי" של יובל דרור שסוקר מערכות ניבוי כושלות שהתיימרו לתת ציונים המנבאים התנהגות ונפלו קורבן לאלגוריתם של עצמם. (זה הזמן להשלים צפייה בפרק ראשון בעונה השלישית של מראה שחורה על דירוג חברתי). במידה רבה זה היה גם היה האירוע של הקורונה, רק במציאות – יש גבול לכמה מודלים יכולים לקחת בחשבון את התנהגות האנשים ברגע שהם רואים אותם. (ומסוכן מדי לנהל על זה ניסוי מסודר עם קבוצת ביקורת). וזה עוד לפני מה שבר סימן טוב גילה על בשרו שתזוזה של 0.1 במספר בתחילת המודל משפיעה על התחזית ל 10,000 מתים בסופו.

אבי היקר, סטטיסטיקאי כבר למעלה מחמישים שנה, לימד אותי את שלושת סוגי השקרים – "שקרים גדולים, שקרים לבנים וסטטיסטיקה" וזה נכון. זה נכון גם לגבי מחיר המניה כמדד להצלחתו של מנכ"ל, כי מה זה משנה מה מחירה היום, משנה מה הוא יהיה בעתיד שאותו הרי יודעים רק שוטים ותינוקות (וגם מה היה מחירה בעבר) וגם את שורת הרווח לא הייתי מציע לזנוח ואת נתוני שביעות רצון העובדים, ורמת המחוברות הארגונית ומיתוג המעסיק ועוד נתונים רבים אחרים שהרבה פעמים לא קיימו תיאום ציפיות אחד עם השני ולא מתנהגים כמו שציפינו מהם.

אז אני מכיר את הסיפור על בילי בין, מנהל קבוצת הבייסבול של אוקלנד אתלטיקס, שבעזרת שיטות מתקדמות לניתוח ביצועים הצליח להביא לקבוצתו את השחקנים שתורמים הכי הרבה אבל עולים הכי מעט (תועד בסרט המומלץ – Moneyball).  ואני לא עד כדי כך רומנטיקן (נו, אבא סטטיסטיקאי, אבל רגע, אמא מורה לספרות) שמאמין שכדברי הנסיך הקטן "אין לראות את הדברים היטב אלא בלב בלבד. כי הדבר החשוב באמת סמוי מן העין" אבל בהחלט אין לי ספק שאת הנתונים כולם יכולים לראות, את הדברים החשובים באמת – פחות.

וזה מה שיש לדן אריאלי לומר על מחקרי Big Data (באדיבות שיר בוים שוורץ):

לקריאה/צפייה נוספת:

טלי שרוט, מה זה משנה – איך אנחנו מצליחים (ומתי אנחנו נכשלים) לשנות את דעותיהם של אחרים, כנרת זמורה ביתן, ינואר 2019.

יובל דרור, קוד סמוי, כל מה שלא רוצים שתדעו ואתם חייבים לדעת על העידן הדיגיטלי, כנרת – זמורה ביתן, ינואר 2019

עומר קורן, ההזדמנות שפספסנו – למה קהילת הדאטה סיינס בישראל לא תרמה כמעט כלום להתמודדות עם משבר הקורונה.

מראה שחורה – פרק 1 עונה 3

Moneyball