מיזוג בין טבלאות באמצעות MySQL

כאשר אנו עושים Merge בין גרסאות, לא מעט פעמים אנו ממזגים בין טבלאות זהות שמכילות נתונים שונים. למרות שיש כלים שונים למיזוג, לפעמים עדיף לעשות את זה עם שאילתה מהירה שמבצעת את המיזוג.

ההנחה היא שסוג הטבלאות וסוג השדות שיש בטבלאות ה-MySQL הוא זהה לחלוטין. במידה ולא, אפשר לשנות את השאילתה בהתאם ולהכניס נתוני דיפולט או נתונים מטבלה אחרת.

הדוגמאות הן דוגמאות אמיתיות מתוך טבלה אמיתי שמודול בדרופל משתמש בה.

תיאור מבנה הנתונים של הטבלה באמצעות Describe:


+----------+------------------+------+-----+---------+----------------+
| Field    | Type             | Null | Key | Default | Extra          |
+----------+------------------+------+-----+---------+----------------+
| pid      | int(10) unsigned | NO   | PRI | NULL    | auto_increment |
| src      | varchar(128)     | NO   | MUL |         |                |
| dst      | varchar(255)     | NO   | MUL |         |                |
| language | varchar(12)      | NO   |     |         |                |
+----------+------------------+------+-----+---------+----------------+


הנה חלק מהטבלה להמחשה:


mysql> select * from url_alias_no1 LIMIT 3;
+-----+-------------------+---------------+----------+
| pid | src               | dst           | language |
+-----+-------------------+---------------+----------+
| 175 | taxonomy/term/60  | entertainment |          |
| 176 | taxonomy/term/54  | tournaments   |          |
| 177 | taxonomy/term/162 | software      |          |
+-----+-------------------+---------------+----------+
3 rows in set (0.00 sec)

כאמור יש לי שתי טבלאות – הראשונה היאurl_alias_no1 והשניה היא url_alias_no2. אני רוצה למזג את שתיהן אל url_alias. כאשר אני לא רוצה שתהיה כפילות בנתונים. אני לא יכול להשתמש ב-Primary key כאן כיוון שיש כפילות בשתי הטבלאות. אני חייב לבחור נתון אחר שאני לא רוצה שתהיה כפילות איתו. במקרה הזה מדובר בשדה src.

תיאור מילולי של השאילתה: בחר את כל הנתונים מהטבלה הראשונה שה-src שלהם לא מופיע ב-src של הטבלה השניה והכנס אותם אל טבלה שלישית.

פעולה ראשונה – יצירת טבלה שלישית חדשה.
אני יוצר עותק של הטבלה השניה url_alias_no2. העותק הוא זהה לחלוטין ושמו כמובן הוא url_alias.


CREATE TABLE url_alias SELECT * FROM url_alias_no_2

פעולה שניה – ההעתקה עצמה

אני משתמש כאן ב-subquery ובאופרטור הנפלא NOT IN:


INSERT INTO url_alias (url_alias.src, url_alias.dst, url_alias.language )
(SELECT url_alias_no_1.src, url_alias_no_1.dst, url_alias_no_1.language 
FROM url_alias_no_1 WHERE url_alias_no_1.src NOT IN (SELECT src FROM url_alias_no_2));

אחרי הרצת השאילתה תהיה לי טבלה ממוזגת. מדובר בשאילתה לא יעילה כלל וכלל, אבל כמובן שבמיזוג לא אכפת לנו מהיעילות כיוון שזה נעשה רק בסביבת פיתוח.

אני מנצל את הבמה להודות לאורן ולרוברט על הרעיון והעזרה.

כדאי תמיד להשאר מעודכנים! הרשמו לעדכונים של האתר במייל! - המייל יישלח כל יום ראשון בעשר בבוקר ויכיל אך ורק את המאמרים שהתפרסמו באינטרנט ישראל. ללא ספאם, ללא הצפות, ללא בלגנים. 🙂

אהבתם? לא אהבתם? דרגו!

לא אהבתי בכלללא אהבתיבסדראהבתיאהבתי מאוד (אין הצבעות)


אל תשארו מאחור! יש עוד מה ללמוד!

הצטרפו לעדכונים!

העדכונים נשלחים אך ורק כאשר האתר מתעדכן.

רן בר-זיק

רן בר-זיק כותב כל המאמרים באינטרנט ישראל, מפתח אינטרנט מנוסה במגוון שפות ופלטפורמות.
ניתן ליצור איתי קשר באמצעות:
כתובת המייל שלי: info@internet-israel.com.
פרופיל הלינקדאין שלי
הטוויטר שלי
פרופיל הפייסבוק שלי
אני תמיד שמח לייעץ ולעזור, אך בשל עומס הפניות הרב, אני לא תמיד מצליח לענות במהירות.

מאמרים אחרונים