מה קובע אם גרף מסויים טוב ואחר - רע?
באופן פשטני, אם גרף עוזר לי להבין את הנתונים מהר ובלי לעוות את המציאות, הוא גרף טוב. אם, לעומת זאת, הגרף גורם לי לטעות לגבי האופי האמיתי של הנתונים או מאלץ אותי לבלות זמן רב בניתוח, הוא גרף גרוע.
מן העקרון הפשוט הזה נגזרות הרבה מאוד המלצות לגבי ה־״עשה״ ו־״אל תעשה״. ככה, למשל, גרף עוגה תלת מימדי היה בעניי החטא הגדול ביותר שאפשר לעשות בהדמיית נתונים. למה? כי העוגה מקשה על הצופה בהשוואת גדלים קרובים, ואם מוסיפים לה עיוותים של תלת מימד, אז בכלל….
שמחתי לראות שבמשאל שפרסמתי מוקדם יותר היום, לא מעט אנשים בחרו בעוגות התלת מימדיות כחטא הגדול ביותר. אבל, ייתכן שכולנו קצת טועים. כי הקריטריונים שרשמתי בתחילת הפוסט ניתנים למדידה. וכשיש נתונים אמפיריים, השיקולים התיאורטיים מקבלים משקל נמוך יותר. אתמול נתקלתי במאמר די מעניין. במאמר, החוקרים חשפו את הנסיינים לשלושה סוגי גרפים ובדקו את הזמן הדרוש לניתוח הגרף ואת גודל הטעויות במהלך הניתוח. שלושת סוגי הגרפים היו: תרשים עוגה ״רגיל״, תרשים עמודות ותרשים עוגה תלת מימדי.
לפי התיאוריה שלי, הסוג האחרון של הגרפים היה צריך להוביל לזמן קריאה הארוך ביותר ולטעויות הגדולות ביותר. ולא כן! ביצועי הנסיינים בכל הגרפים היו זהים.
מה ניתן ללמוד מזה? שיקולים עקרוניים זה טוב, אבל כדאי לבדוק אותם מדי פעם בעזרת ניסויים.
האם מעכשיו אתחיל ליצור עוגות תלת מימדיות? ממש ממש לא! אני כבר זקן מדי כדי לשנות את דרכי. האם אני אנזוף בסטודנטים שלי שייצרו עוגות תלת מימדיות בתרגילים? עדיין כן, אני כבר זקן מדי כדי לשנות גם את זה. האם אני אראה לסטודנטים את המחקר הזה ואחפש מחקרים דומים אחרים? כן וכן.