כשאתר שמבוסס על LAMP מתחיל לקרטע, או שמקרטע מההתחלה, אחד החשודים המידיים הוא ה-MySQL. מסד הנתונים בדרך כלל מהווה את צוואר הבקבוק שגורם לביצועים לג'עג'ע. זה יכול להיות (למשל) בגלל שאילתה שבודקת user לפי שם. משהו בסגנון
SELECT user.id FROM users WHERE user.name LIKE '%S%';
יכולה לעבוד מעולה אם יש לנו 100 או 200 משתמשים. היא תהיה מאוד איטית אם יש הרבה יותר. השאלה הנשאלת היא איך אני יכול לדעת את זה? התשובה היא לבדוק את השאילתות האיטיות ב-MySQL. אלו שלוקחות המון המון זמן, או אלו שמחזיקות ה-מ-ו-ן תוצאות. כאלו שצד השרת צריך להזיע עליהן באופן רציני ביותר. איך עושים את זה? עם MySQL Query Log.
מדובר בלוג מיוחד אשר שומר שאילתות איטיות. כמה איטיות? אנחנו קובעים! איך בדיוק? יש גם בלינוקס וגם בחלונות קובץ הגדרות של MySQL. בלינוקס הוא נקרא my.cnf ונמצא ב: /etc/mysql/my.cnf. אם אתם משתמשים ב-WAMP אז אפשר לגשת אליו מהתפריט ב-System tray. אם אתם משתמשים ב-MySQL בחלונות אז אללה ירחמו.
בבתחילת הקובץ אפשר למצוא את:
[mysqld]
# -- @LT enable logging
log_slow_queries = /var/log/mysql/mysql-slow.log
long_query_time = 1
log-queries-not-using-indexes
הקובץ מכיל את השאילתות האיטיות: /var/log/mysql/mysql-slow.log. מה זה איטיות? כאלו שעוברות את משך השניות שמפורטות ב -long_query_time.
אנחנו יכולים לגשת אל הקובץ הזה ידנית, או עם tail -f על מנת שיציג לנו את השינויים האחרונים. אבל יותר חכם להשתמש בכלי שיציג לנו את השאילתות האיטיות. יש המוני כלים כאלו, אבל ל-MySQL יש את הכלי שלו שתמיד זמין עם כל גרסה של MySQL. הכלי הזה הוא mysqldumpslow ואני אסביר מעט עליו.
איך משתמשים בו? באופן עקרוני בדרך הזו:
mysqldumpslow /var/log/mysql/mysql-slow.log
הוא יציג לי תקציר מנהלים של ה-Queries האיטיות שנאספו בלוג. שימו לב שאם אתם משנים את long_query_time, זה לא ישפיע על מה שנכנס ללוג בעבר אלא רק מהנקודה ששיניתם (ועשיתם ריסטרט ל-MySQL כמובן).
מה אני אקבל? משהו כזה:
Count: 47 Time=0.08s (3s) Lock=0.00s (0s) Rows=1.0 (47), 'XXXX@localhost
SELECT DISTINCT u.uid, u.name, u.access FROM users u LEFT JOIN users_things r ON u.uid = r.uid WHERE (u.uid = N OR r.rid IN (N)) AND u.status > N ORDER BY u.access DESC LIMIT N, N
כאשר זה מאוד ברור מה אני מקבל פה – ה-count הוא מספר הפעמים שהשאילתה רצה. ה-Time הוא הזמן הממוצע של כל שאילתה. ה-Lock הוא משך הזמן שהשאילתה נעלה את הטבלה. ה-Rows הוא מספר השורות שהוחזרו.
מה שחזק בפקודה הוא האופרטורים המפורטים בדוקומנטציה:
Format | Description |
---|---|
-a | Do not abstract all numbers to N and strings to S |
-n num | Abstract numbers with at least the specified digits |
–debug | Write debugging information |
-g pattern | Only consider statements that match the pattern |
–help | Display help message and exit |
-h name | Host name of the server in the log file name |
-i name | Name of the server instance |
-l | Do not subtract lock time from total time |
-r | Reverse the sort order |
-s value | How to sort output |
-t num | Display only first num queries |
–verbose | Verbose mode |
בעזרתם אני יכול ממש לבקש מ-mysqldumpslow דו"חות מפורטים עם אגרגציות שונות.
בגדול slow query log הוא הצעד הראשון והבסיסי ביותר בכל מה שקשור לבדיקה למה אפליקציה עובדת לאט. במקרה של אפליקציות מבוססות LAMP, בחלק גדול של המקרים תוכלו לעשות אופטימיזציות מספקות באמצעות מעבר ותיקון השאילתות המופיעות בלוג.
ישנן לא מעט מוצרים של חברות שונות שמתחברות ללוג ונותנות ניתוח מקיף יותר – אבל כאן מדובר בתוכנה שבאה כבר עם ההפצה של MySQL ושווה להכיר אותה.