מיזוג בין טבלאות באמצעות MySQL

הסבר על מיזוג טבלאותב-MySQL עם דוגמא מהמציאות ושימוש באופרטור NOT IN ו-Subquery.

כאשר אנו עושים Merge בין גרסאות, לא מעט פעמים אנו ממזגים בין טבלאות זהות שמכילות נתונים שונים. למרות שיש כלים שונים למיזוג, לפעמים עדיף לעשות את זה עם שאילתה מהירה שמבצעת את המיזוג.

ההנחה היא שסוג הטבלאות וסוג השדות שיש בטבלאות ה-MySQL הוא זהה לחלוטין. במידה ולא, אפשר לשנות את השאילתה בהתאם ולהכניס נתוני דיפולט או נתונים מטבלה אחרת.

הדוגמאות הן דוגמאות אמיתיות מתוך טבלה אמיתי שמודול בדרופל משתמש בה.

תיאור מבנה הנתונים של הטבלה באמצעות Describe:


+----------+------------------+------+-----+---------+----------------+
| Field    | Type             | Null | Key | Default | Extra          |
+----------+------------------+------+-----+---------+----------------+
| pid      | int(10) unsigned | NO   | PRI | NULL    | auto_increment |
| src      | varchar(128)     | NO   | MUL |         |                |
| dst      | varchar(255)     | NO   | MUL |         |                |
| language | varchar(12)      | NO   |     |         |                |
+----------+------------------+------+-----+---------+----------------+


הנה חלק מהטבלה להמחשה:


mysql> select * from url_alias_no1 LIMIT 3;
+-----+-------------------+---------------+----------+
| pid | src               | dst           | language |
+-----+-------------------+---------------+----------+
| 175 | taxonomy/term/60  | entertainment |          |
| 176 | taxonomy/term/54  | tournaments   |          |
| 177 | taxonomy/term/162 | software      |          |
+-----+-------------------+---------------+----------+
3 rows in set (0.00 sec)

כאמור יש לי שתי טבלאות – הראשונה היאurl_alias_no1 והשניה היא url_alias_no2. אני רוצה למזג את שתיהן אל url_alias. כאשר אני לא רוצה שתהיה כפילות בנתונים. אני לא יכול להשתמש ב-Primary key כאן כיוון שיש כפילות בשתי הטבלאות. אני חייב לבחור נתון אחר שאני לא רוצה שתהיה כפילות איתו. במקרה הזה מדובר בשדה src.

תיאור מילולי של השאילתה: בחר את כל הנתונים מהטבלה הראשונה שה-src שלהם לא מופיע ב-src של הטבלה השניה והכנס אותם אל טבלה שלישית.

פעולה ראשונה – יצירת טבלה שלישית חדשה.
אני יוצר עותק של הטבלה השניה url_alias_no2. העותק הוא זהה לחלוטין ושמו כמובן הוא url_alias.


CREATE TABLE url_alias SELECT * FROM url_alias_no_2

פעולה שניה – ההעתקה עצמה

אני משתמש כאן ב-subquery ובאופרטור הנפלא NOT IN:


INSERT INTO url_alias (url_alias.src, url_alias.dst, url_alias.language )
(SELECT url_alias_no_1.src, url_alias_no_1.dst, url_alias_no_1.language 
FROM url_alias_no_1 WHERE url_alias_no_1.src NOT IN (SELECT src FROM url_alias_no_2));

אחרי הרצת השאילתה תהיה לי טבלה ממוזגת. מדובר בשאילתה לא יעילה כלל וכלל, אבל כמובן שבמיזוג לא אכפת לנו מהיעילות כיוון שזה נעשה רק בסביבת פיתוח.

אני מנצל את הבמה להודות לאורן ולרוברט על הרעיון והעזרה.

פוסטים נוספים שכדאי לקרוא

למפתחי ובוני אתרי אינטרנט

מדריך לשאילתות יעילות ל Chat GPT

כל אחד יכול לשאול את GPT, אבל אם תרצו לשאול אותו שאלות על תכנות – יש כמה שיטות וטיפים ליעל את העבודה מולו.

פיתוח ב-JavaScript

Axios interceptors

תכנון נכון של קריאות AJAX באפליקציה ריאקטית וניהול השגיאות או ההצלחות עם פיצ׳ר נחמד של axios

עבודה בהיי טק

איך מראיינים סניורים?

השיטה שלי לבדיקת התאמה טכנית למתכנתות ולמתכנתים בכירים עם כמה שנות ניסיון.

גלילה לראש העמוד