במאמר הקודם למדנו כיצד לעבוד עם הרחבת MySQLi של PHP ובכך בעצם סיימנו את החלק הראשון של המדריך. החלק הראשון מסביר איך לכתוב שאילתות ולטפל במסד נתונים קיים. המאמרים במדריך מכאן והלאה ידונו יותר בתכנון (design) ובבנייה מאפס של מערך מסדי נתונים.
תכנון של מסד נתונים הוא עולם ומלואו. אני לא מתיימר ללמד כאן את כל אמנות התכנון של מסד הנתונים (או אפילו להתקרב לזה). אבל על מנת להבין דברים כמו אינדקסים ונורמליזציה, אנחנו צריכים להבין מעט מה זה תכנון של מסד נתונים. זה לא אומר שמפתחים לא יכולים לתכנן מסדי נתונים בעצמם, אבל תכנון של מסדי נתונים שמשרתים מיליוני אנשים כל רגע נתון הוא מלאכתם של מקצוענים ולא כל אחד שיודע מה זה CREATE TABLE או אפילו מה זה נורמליזציה.
חמושים בתובנה זו ובענווה המתבקשת, אנו נמשיך את המסע להכרה יותר טובה של מסדי נתונים. הצעד הראשון הוא ללמוד על מודלים של מסדי נתונים.
מה זה מודלים של מסד נתונים?
ראשית עלינו לבצע את האבחנה בין מסד נתונים למודל מסד נתונים. מסד נתונים יכול להיות כל דבר – מאוסף קבצי מחשב ועד לדפי נייר. מסדי נתונים מכילים בדרך כלל מידע ומטא-מידע – מידע על דרך סידור הנתונים והנתונים עצמם. כך למשל, אנציקלופדיה מנייר מכילה מידע והאינדקסים שלה (והמוסכמות השונות שלפיהם מסודר המידע בכרכים השונים כמו לפי א'-ב' ושם משפחה לפני שם פרטי) הם המטא מידע.
מודל מסד נתונים הוא התכנון שלפיו מסד הנתונים בנוי. סוג של סקיצה שלפיה הנתונים ייכנסו לתוך מערכת המחשב שלנו. כאשר אנו בוחרים את מודל מסד הנתונים המבוקש לפי האפליקציה שמשתמשת בו. אפליקציה היא סוג של תוכנת מחשב – בין אם מדובר בוורדפרס או תוכנת פלאש המתממשקת למסד נתונים. אפליקציה לא חייבת להיות מבוססת ווב, היא יכולה להיות גם תוכנת אחזור שכלכלנים משתמשים בה כדי לאחזר נתוני מכירות של הארגון.
לרוב אנו נשתמש באפליקציות ווביות (לא נראה לי שמי שעובד על DB2 צריך את המדריך הזה) וזה מחייב מסד נתונים מסוג OLTP – מסד נתונים שמגיב לפעולות מצד המשתמש (או האפליקציה) ומאחזר במהירות פיסות קטנות של מידע למספר רב של מקורות. בניגוד ל-Data warehouse שמעבירה כמויות של מידע עם זמן תגובה ארוך. דפי שציינתי, אנו נעסוק במדריך זה רק ב-OLTP ולא ב-Data warehouse.
התפתחות של מודלים של מסדי נתונים
על מנת להבין את ההווה, לעיתים צריך גם להסתכל במעט על העבר.
מודל מסד נתונים של קובץ
במודל זה, שכבר לא נעשה בו שימוש כיום, כל המידע נשפך לתוך קובץ אחד ללא כל היררכיה. הכוונה לא לסוג קובץ כמוCSV כי בו יש פסיקים וסימנים אחרים שמבטאים היררכיה אלא לקובץ שבו אין שום סימנים.
מודל מסד נתונים היררכי
במודל זה, ישנה כבר היררכיה אבל היא רק היררכיה של יחיד לרבים (one to many). המונח יחיד לרבים הוא חשוב. זאת אומרת שפריט מידע אחד יכול להיות הורה להרבה פריטי מידע אך לכל פריט מידע יש הורה אחד בלבד. כך זה נראה בתרשים. שימו לב לשני דברים חשובים – כיוון החץ שמראה את הקשר בין ההורה לבן שלו ואת הסימנים n (רבים) ו-1 (יחיד). מדובר בסימנים שהם סטנדרטיים בכל נושא עיצוב מסדי הנתונים.
מודל מסד נתונים של רשת
המודל הזה זהה למודל ההיררכי, רק שכאן אנו מכניסים את היחס של רבים לרבים (many to many). כלומר, לפריט מידע אחד יכולים להיות כמה הורים. כך למשל, מנהל אחד יכול להיות בכמה חטיבות וכמה עובדים יכולים להיות באותה משימה.
מודל מסד נתונים יחסי
מודל מסד נתונים יחסי או Relational Database Model הוא המודל שמשמש את MySQL. המודל הזה דומה למודל הרשתי שקדם לו. רק שכאן אני יכול לגשת לכל טבלה באופן ישיר ולא לעבור דרך ההיררכיה. כך למשל, אם אני רוצה לגשת לטבלת העובדים, אני לא צריך לעבור דרך טבלת החטיבה, המחלקה והמנהלים. בנוסף, אני יכול לקשר כל טבלה לפי רצוני. כך למשל, אם אני רוצה לקשר בין מנהלים למשימות, אני יכול לעשות זאת. בשם אחר, זו היכולת לבצע JOIN בין כל טבלה לטבלה. MySQL מסוגל כמובן לבצע JOIN בין כל טבלה לכל טבלה (אם יש קשר ביניהן).
כך למשל בדיאגרמה שלנו, אני יכול לקשר בין טבלת העובדים לטבלת הפרויקטים כאשר הקשר הוא רבים לרבים. כמה עובדים יכולים להשתייך לפרוייקט אחד (או יותר) וכמה פרוייקטים יכולים להשתייך לעובד אחד (או יותר).
תכנון של מסד נתונים של MySQL יראה כמו הדיאגרמה. בין חלק מהטבלאות יש קשר של יחיד לרבים ולעתים יש גם קשר של רבים לרבים. טבלאות שונות יכולות להיות מקושרות ללא תלות במקום שלהן בהיררכיה.
מודל מסד נתונים מונחה עצמים
זהו מודל חדש יחסית שמבוסס על עצמים בדומה לתכנות מונחה עצמים. MySQL אינו מסוגל לעבוד במודל זה ולפיכך לא ארחיב עליו את הדיבור. לאלו מכם שמתעניינים – יש את סדרת המדריכים שלי על MongoDB המסבירה על כך באתר זה.
⚠️המדריכים כאן הם טעימה בלבד! יש ספר מקיף המלמד MySQL מרמת בסיס ועד רמה מתקדמת. הספר הדיגיטלי, שרלוונטי גם לכל מסדי הנתונים שעובדים עם SQL – זמין כאן כחלק מהפרויקט "ללמוד ג'אווהסקריפט בעברית" – זו הדרך הטובה ביותר ללמוד באופן מקיף MySQL.
במאמר הבא אנו נתחיל ללמוד על נורמליזציה של נתונים.