מיזוג בין טבלאות באמצעות MySQL

הסבר על מיזוג טבלאותב-MySQL עם דוגמא מהמציאות ושימוש באופרטור NOT IN ו-Subquery.

כאשר אנו עושים Merge בין גרסאות, לא מעט פעמים אנו ממזגים בין טבלאות זהות שמכילות נתונים שונים. למרות שיש כלים שונים למיזוג, לפעמים עדיף לעשות את זה עם שאילתה מהירה שמבצעת את המיזוג.

ההנחה היא שסוג הטבלאות וסוג השדות שיש בטבלאות ה-MySQL הוא זהה לחלוטין. במידה ולא, אפשר לשנות את השאילתה בהתאם ולהכניס נתוני דיפולט או נתונים מטבלה אחרת.

הדוגמאות הן דוגמאות אמיתיות מתוך טבלה אמיתי שמודול בדרופל משתמש בה.

תיאור מבנה הנתונים של הטבלה באמצעות Describe:


+----------+------------------+------+-----+---------+----------------+
| Field    | Type             | Null | Key | Default | Extra          |
+----------+------------------+------+-----+---------+----------------+
| pid      | int(10) unsigned | NO   | PRI | NULL    | auto_increment |
| src      | varchar(128)     | NO   | MUL |         |                |
| dst      | varchar(255)     | NO   | MUL |         |                |
| language | varchar(12)      | NO   |     |         |                |
+----------+------------------+------+-----+---------+----------------+


הנה חלק מהטבלה להמחשה:


mysql> select * from url_alias_no1 LIMIT 3;
+-----+-------------------+---------------+----------+
| pid | src               | dst           | language |
+-----+-------------------+---------------+----------+
| 175 | taxonomy/term/60  | entertainment |          |
| 176 | taxonomy/term/54  | tournaments   |          |
| 177 | taxonomy/term/162 | software      |          |
+-----+-------------------+---------------+----------+
3 rows in set (0.00 sec)

כאמור יש לי שתי טבלאות – הראשונה היאurl_alias_no1 והשניה היא url_alias_no2. אני רוצה למזג את שתיהן אל url_alias. כאשר אני לא רוצה שתהיה כפילות בנתונים. אני לא יכול להשתמש ב-Primary key כאן כיוון שיש כפילות בשתי הטבלאות. אני חייב לבחור נתון אחר שאני לא רוצה שתהיה כפילות איתו. במקרה הזה מדובר בשדה src.

תיאור מילולי של השאילתה: בחר את כל הנתונים מהטבלה הראשונה שה-src שלהם לא מופיע ב-src של הטבלה השניה והכנס אותם אל טבלה שלישית.

פעולה ראשונה – יצירת טבלה שלישית חדשה.
אני יוצר עותק של הטבלה השניה url_alias_no2. העותק הוא זהה לחלוטין ושמו כמובן הוא url_alias.


CREATE TABLE url_alias SELECT * FROM url_alias_no_2

פעולה שניה – ההעתקה עצמה

אני משתמש כאן ב-subquery ובאופרטור הנפלא NOT IN:


INSERT INTO url_alias (url_alias.src, url_alias.dst, url_alias.language )
(SELECT url_alias_no_1.src, url_alias_no_1.dst, url_alias_no_1.language 
FROM url_alias_no_1 WHERE url_alias_no_1.src NOT IN (SELECT src FROM url_alias_no_2));

אחרי הרצת השאילתה תהיה לי טבלה ממוזגת. מדובר בשאילתה לא יעילה כלל וכלל, אבל כמובן שבמיזוג לא אכפת לנו מהיעילות כיוון שזה נעשה רק בסביבת פיתוח.

אני מנצל את הבמה להודות לאורן ולרוברט על הרעיון והעזרה.

פוסטים נוספים שכדאי לקרוא

תמונה של הבית הלבן עם מחשוב ענן וטקסט: FEDRAMP
פתרונות ומאמרים על פיתוח אינטרנט

FedRAMP & FIPS מבוא למתחילים

פרק מיוחד, לצד הקלטה של פרק של עושים תוכנה על אחת התקינות החשובות ביותר עבור חברות שסביר להניח שלא הכרתם

גלילה לראש העמוד