Wydajność baz danych

14 July 2008 Comments

Niniejszy artykuł zawiera różne wskazówki i rady jak zwiększyć wydajność baz danych (zazwyczaj tekst odnosi się do MySQL lub PostgreSQL).

MySQL

Ciekawy artykuł z www.netcoffee.pl: Optymalizacja bazy MySQL - część II
W skrócie: używaj pól o jak najmniejszym rozmiarze, deklaruj kolumny jako NOT NULL, dla tabel MyISAM używaj rekordu o stałej długości, podstawowy indeks tabeli powinien być tak mały, jak to możliwe, twórz indeksy których naprawdę potrzebujesz, pierwsza kolumna złożonego klucza powinna być kolumną najczęściej używaną, nie używaj znaków wieloznacznych na początku porównania LIKE, używaj pól typu ENUM jeżeli to możliwe.

Tabele InnoDB

Długi PRIMARY KEY zajmuje sporo miejsca, zaleca się ustawianiem kolumny AUTO_INCREMENT jako PRIMARY KEY
Maksymalne rozmiary logów powinny być dość duże. Operowanie na wielu małych plikach to zbędne operacje I/O
Używaj VARCHAR a nie CHAR jeżeli kolumna zawiera łańcuchy o zmiennej długości lub dużą ilość pól o wartości NULL
Jeżeli dodajesz dużo danych po kolei wyłącz AUTO COMMIT (SET AUTOCOMMIT=0;) jako że każdy INSERT powodowałby "czyszczenie" logów
Duże ROLLBACKi są znacznie wolniejsze niż INSERTy
Wystrzegaj się operacji wymagających dużej ilości operacji na dysku. Używaj DROP TABLE a nie DELETE FROM
Używaj składnię wielowierszowego INSERTa do dodania wielu wierszy (INSERT INTO tabela VALUES (1,2), (5,5), ...;)
Jeżeli tabele mają UNIQUE lub FOREIGN KEY na kolumna z SECONDARY KEY to przy imporcie danych warto wyłączyć sprawdzanie obu tych "warunków" (SET UNIQUE_CHECKS=0; ..import.. SET UNIQUE_CHECKS=1;) (SET FOREIGN_KEY_CHECKS=0;... import ...SET FOREIGN_KEY_CHECKS=1;)
Na niektórych unixach/Linuksach operacje wykonywane z pomocą wywołania fsync() mogą być bardzo wolne. Ustawienie innodb_flush_method na O_DSYNC może przynieść niespodziewaną zmianę wydajności.

PostgreSQL

Wydajność postgresa zależy od wielu czynników, jednym z podstawowych jest konfiguracja. Kilka opcji ustawień możne znacząco wpłynąć na osiągi tej bazy danych:

max_connections = (num) - określa maksymalną ilość jednoczesnych połączeń. Zbyt wysoka wartość może doprowadzić do zajęcia całego RAMu i wejścia bazy w SWAP co spowolni cały system.
shared_buffers = (num) - Domyślna wartość to 1000 i uważana jest na za niską jak na współczesny sprzęt. Podana wartość powinna odpowiadać 10-15% posiadanego RAMu (zazwyczaj około 10 000 - 20 000)
work_mem = (num) - Opcja kontrolująca ilość zasobów pamięci używanych dla sortowań i haszowych tabel. Jeżeli wykonujesz dużo takich operacji możesz zwiększyć limit pamięci ale zwróć uwagę że limit ten dotyczy każdego zapytania (a kilka zapytań wykonywanych przez naszą aplikację + możliwość wykonywania takich zapytań równocześnie może szybko wyczerpać zapasy RAMu)
max_fsm_pages = (num) - Ta opcja pomaga kontrolować mapę wolnego miejsca (free space map). Gdy coś jest kasowane z tabeli to nie jest od razu usuwane z dysku. Po prostu jest oznaczane jako "wolne" w mapie wolnego miejsca. To miejsce może być użyte przez nowe INSERTy dotyczące danej tabeli. Jeżeli wykonujesz dużo operacji DELETE i INSERT z tabeli/tabel będziesz musiał zwiększyć tą wartość w celu uniknięcia śmieci w tabeli.
effective_cache_size = (num) - wartość pomaga podjąć decyzję bazie danych czy użyć indeksu czy nie. Im wyższa wartość tym większe szanse na użycie indeksu. Parametr ten określa wydajność keszu dysku używanego systemu operacyjnego.

Procesor - im lepszy procesor tym lepiej, ale jeżeli nie wykonujesz w bazie złożonych funkcji to lepiej zainwestować w lepszy dysk. Nie zaleca się procesorów Intel Xeon jako że są z nimi problemy, które obniżają wydajność. Chwalone są za to Opterony
RAM - im więcej RAMu tym więcej keszu dysku. Operacje I/O w RAMie są tysiąc razy szybsze niż takowe na dysku
Dysk - polecane są dyski SCSI Ultra-320, lecz wysokiej klasy dyski SATA też są bardzo dobre.
Konfiguracja Dysku - optymalna konfiguracja to RAID 1+0 z maksymalnie dużą ilością dysków i z logiem transakcji(pg_xlog) na oddzielnym dysku. RAID 5 nie jest zbyt dobrym rozwiązaniem, chyba że masz więcej niż 6 dysków w woluminie. W nowszych wersjach postgresa można rozmieszczać tabele (i nie tylko) na różnych dyskach/partycjach. Często używane tabele/dane powinny znajdować się na najlepszym dysku.
Oprócz tego warto trzymać bazę na oddzielnej maszynie nie zajętej przy okazji np. serwerem www.

Zobacz także PostgreSQL 8.0 Performance Checklist

RkBlog

Podstawy PHP, 14 July 2008

Comment article

PHPCon PL 2015 w tym roku w listopadzie w Rawie Mazowieckiej

Z PHP nie mam już prawie w ogóle do czynienia, ale programistom PHP mogę polecić konferencję PHPCon PL, która w tym roku odbędzie się w Rawie Mazowieckiej od 13 do 15 listopada. Więcej szczegółów na stronie phpcon.

› Read more

PHPCon Poland 2014 - prelengenci poszukiwani

Jeszcze do końca maja można zgłaszać propozycje prelekcji na tegoroczny, piąty już PHPCon Poland - największą konferencję w Europie Środkowej poświęconą w całości językowi PHP. Jeśli pracujesz w PHP i czujesz się na siłach, by zaprezentować jakieś ciekawe zagadnienie dotyczące tego języka, podziel się swoją wiedzą z innymi i zgłoś propozycję na phpcon.pl. Jako zakwalifikowany prelegent, będziesz miał prawo do zwrotu całości opłaty za uczestnictwo.

› Read more

Pełnotekstowe wyszukiwanie w SQLite i PHP5

Opis zastosowania modułu SQLite FTS3 do pełnotekstowego wyszukiwania rekordów

› Read more

PHP 5.3.0 wydane

Wydano pierwszą stabilną wersję PHP 5.3. Nowa wersja wnosi sporo zmian do języka. Dodano funkcje lambda, przestrzenie nazw, kontrowersyjne goto, nowe rozszerzenia (ext/phar, ext/intl, ext/fileinfo, ext/sqlite3, ext/enchant), oraz wiele poprawek.

› Read more

Dlaczego PHP nie kształci dobrych programistów?

Na forum php.pl znalazłem bardzo ciekawy link prowadzący na listę dostępnych funkcji PHP na serwerach WP. Jak widać oferta jest... śmieszna? - po pierwsze mamy przestarzałe i niewspierane już PHP4, po drugie wystarczy popatrzeć jakie funkcje zostały wyłączone by paść ze śmiechu. Niestety masowy hosting o praktycznie zerowych możliwościach - darmowy, czy też płatny nie jest czymś odosobnionym. Nic dziwnego że "dzieci" chcące zrobić "stronkę w PHP" trafiają na takie "usługi" i zamiast uczyć czegoś związanego z umiejętnością programowania w PHP uczą się kopiowania ograniczonych skrypcików działających na takich "serwerach". Nie umieją korzystać z baz danych, czy też stosować poprawnych struktur kodu, frameworków. Spędzając dłuższy czas w takim sosie błędne nawyki zaczynają się utrwalać, a przekonani o swojej genialności script kiddies dołują całą platformę PHP.

Rozwiązanie nie jest łatwe i wymagałoby radykalnych działań twórców PHP - wymuszenie bezwzględnego używania nowszych wersji PHP (zmiana licencji?), ograniczenie możliwości wyłączania części funkcjonalności języka (czy to z chęci zysku, czy z głupoty pseudoadmina), a także łatwiejsze rozwiązania do poszerzania funkcjonalności (skryptowe i binarne rozszerzenia) podobnie jak w Pythonie, czy Ruby.

Z PHP-Socjologicznego punktu widzenia bardzo ciekawe byłoby dodanie obsługi PHP w usługach typu Google App Engie. Interpreter byłby stosowanie dostosowany - brak operacji na pliczkach, brak safe mod, latania po katalogach itp. Darmowy fajny hosting, na którym nie działałyby istniejące skrypciki :) Co wtedy zrobiliby script kiddies? Paru zapewne będzie chciało "wrzucić" MySQLa razem z projektem, ale ci jeszcze całkowicie nie odmóżdżeni "w końcu" by się czegoś nauczyli - mając platformę, na której "lepszy" kod działa.

› Read more

Co nowego w PHP 5.3?

1 sierpnia wydano pierwszą wersję alfa PHP 5.3 - służącą jako przegląd nowych możliwości dla programistów i do wyłapywania błędów. PHP z serii 5.3 wprowadza sporo nowych funkcjonalności takich jak:

Przestrzenie nazw (namespaces) - czyli kontrolowanie zasięgu klas, metod, funkcji w obrębie kodu PHP umożliwiając np. stosowanie funkcji o takich samych nazwach w różnych obrębach aplikacji. (Dokumentacja)
Odwoływanie się do metod statycznych (Late Static Bindings) - możliwość odwoływania się m.in. do statycznych metod klasy poprzez static::nazwametody();. (Dokumentacja)
Nowa metoda magiczna __callStatic() - wykonywana przy próbie wywołania niedostępnej metody w statycznym kontekście. (Dokumentacja)
Funkcje Lambda i domykanie (Closure) - Funkcje lambda to proste jednolinijkowe funkcje, wykorzystywane w przypadkach, gdy np. potrzebujemy prostej funkcji w danym fragmencie aplikacji do wykonania prostej czynności. Zamiast definiować zwykłą funkcję, można skorzystać z funkcji lambda bezpośrednio w miejscu jej wykorzystania. Domknięcia (closures) poszerzają użyteczność funkcji lambda, a polegają na "zaszywaniem" zmiennych lokalnych w funkcjach (np. zmienne zwykłej funkcji dostępne w funkcji lambda stworzonej wewnątrz niej. (Dokumentacja)
Rozszerzenia Phar, intl i sqlite3 - Phar to odpowiednik na plik-kontenery JAR w Javie. Phar umożliwia budowanie pakietów z całych aplikacji w jednym pliku, co ma za zadanie ułatwienie dystrybuowania gotowych aplikacji. intl to rozszerzenie obsługujące internacjonalizację.
Natywny sterownik mysql - natywny dla PHP sterownik MySQLnd zastępuje libmysql
Brak wsparcia dla Windows 98, NT4, ME - PHP 5.3 nie będzie już obsługiwać starszych wersji MS Windows.

Więcej znajdziemy na blogu rooftopsolutions.nl, czy też na php.pl.

› Read more