středa 2. května 2007

Sizing dátového skladu

Urobiť sizing pre dátový sklad je ošemetná záležitosť. Väčšinou nie je dosť dobre jasné akej záťaži bude systém v konečnom dôsledku vystavený a tak nám zostáva iba kvalifikovaný odhad. Pokiaľ by ste sa ocitli v topánkach odhadcu, tak Vám môžu pomocť tzv. referenčné konfigurácie, ktoré vznikajú v rámci aliancií softvérových a hardvérových dodávateľov. Príkladom môže byť referenčné konfigurácie vytvorené v spolupráci so Sun.

Sun Small Reference Configuration for Oracle DWH
Sun Medium Reference Configuration for Oracle DWH
Sun Large Reference Configuration for Oracle DWH

Niekoľko praktických rád:
  • HW od rôznych dodávateľov sa dá porovnať pomocou databázy štandardných benchmarkov napr. www.spec.org
  • I/O je najužšie miesto dátového skladu. Oracle databáza je schopná teoreticky spracovať až 300+MB/s na GHz/CPU (direct read, parallel table scan, multi-block reads)
  • V praxi rátajte I/O 75-100MB/s na GHz/CPU (TPC-H benchmark je cca 200MB/3GHz Xeon)
  • Priepustnosť systému môžete otestovať nástrojom Orion, ktorý simuluje I/O operácie generované Oracle databázou

Príklad porovnania absolutnú priepustnosti systému a ako dokáže Oracle databáza facilitovať I/O.

Z porovnania nám vyšlo, že Oracle databáza vie efektívne využiť až 90% I/O zdrojov. Absolutnú priepustnosť sme simulovali príkazom
  • dd bs=1048576 if=/raw/data_1 of=/dev/null count=10000


Prehľad priepustností rôzny technológií:


Akú máte skúsenosť so sizingom dátového skladu Vy?




Žádné komentáře: