AUT - QPM: چارچوبی نو در ارزيابی پرس و جو براي تصميم‌گيري در ايجاد پايگاه داده تحليلي

محورهای موضوعی : مهندسی برق و کامپیوتر

نگین دانشپور ^{1
*} , احمد عبداله‌زاده بارفروش ²

1 - دانشگاه صنعتی امیرکبیر
2 - دانشگاه صنعتی امیرکبیر

تاریخ دریافت : 1385/07/01 تاریخ پذیرش : 1386/03/19 تاریخ انتشار : 1387/01/02

کلید واژه: پايگاه داده تحليليپرس و جوشبيه‌سازطراحی پايگاه داده تحليليمتدولوژيمهندسی نرم‌افزار,

چکیده مقاله :

دليل اصلي شكست سيستم‌هاي پايگاه داده تحليلي، عدم تشخيص لزوم ايجاد آنهاست. تحليل لزوم ايجاد پايگاه داده تحليلي داراي اهميت بسيار زيادي است. در اين مقاله چارچوبی با نام AUT-QPM برای بررسی لزوم ايجاد پايگاه داده تحليلي، بر اساس نوع پرس و جوهای مطرح در آن، ارائه مي‌گردد. به اين منظور ابتدا انواع پرس و جو دسته‌بندي شده و سپس بر روي يك پايگاه داده عملياتی و پايگاه داده تحليلي متناظر با آن با سايزهاي مختلف اعمال می‌شود. سپس به منظور ارزيابی پرس و جو، پارامترهای مورد بررسی ارائه می‌گردند که عبارتند از زمان پاسخ پرس و جو و تعداد مراجعات به ديسک. با بررسی اين پارامترها به منظور پاسخ‌گويي به پرس و جو، ملاحظه می‌شود كه در رابطه با پرس و جوهاي چندبعدي و مجتمع، وجود پايگاه داده تحليلي ضروري بوده و در رابطه با پرس و جوهاي تو در تو و پيوندي، استفاده از پايگاه داده تحليلي مفيد بوده و براي پرس و جوهاي ساده و محاسباتي، استفاده از پايگاه داده عملياتی مناسب‌تراست.

چکیده انگلیسی:

The main reason of data warehouse systems failure is lack of justification proof. Analysis is an important task for decision about data warehouse creation. In this paper, we present the framework to justify data warehouse based on the input query types. We classify query types and execute them on the databases and data warehouses with different sizes. The query response time and the number of I/O are evaluation parameters. In the experiments, different types of queries have been processed on databases and data warehouses and the results based on time and memory have been compared. These results are presented below: • For answering multidimensional queries and aggregated queries data warehouse systems will be required, • For answering nested queries and join queries, data warehouse system will be useful, • Database systems will be proper for answering simple queries and computational queries. In this work, the tools which can process the above ideas have been produced. The software will take user query and evaluate its process to decide having or not having data warehouses.

منابع و مأخذ:

[1] R. Kimball and M. Ross, The Data Warehouse Toolkit: the Complete Guide to Dimensional Modeling, 2nd Edition, John Wiley & Sons, pp. 1-27, 2002.
[2] J. Han and M. Kamber, Data Mining Concepts and Techniques, NewYork, NY: Morgan Kaufman, pp. 39-98, 2001.
[3] R. Kimball and J. Caserta, The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data, John Wiley & Sons, pp. 29-52, 2004.
[4] C. Imhoff, N. Galemmo, and J. G. Geiger, Mastering Data Warehouse Design: Relational and Dimensional Techniques, John Wiley & Sons, pp. 3-26, 2003.
[5] R. Kimball, L. Reeves, M. Ross, and W. Thornthwaite, The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing, and Deploying Data Warehouses, John Wiley & Sons, pp. 31-40, 1998.
[6] P. Ponniah, Data Warehousing Fundamentals, pp. 63-86, 2001.
[7] A. Silberschatz, H. F. Korth, and S. Sudarshan, Database System Concepts, Fifth ed. MC Graw - Hill, pp. 75-115, 2005.
[8] J. Ullman and J. Widom, A First Course in Database Systems,Prentice Hall, New Jersey, 2001.
[9] C. J. Date, An Introduction to Database Systems, Eight ed. Addison-Wesley, 2004.
[10] G. Gottlob, C. Koch, and K. U. Schulz et all, Conjunctive Queries Over Trees, ACM, PODS, pp. 189-200, 2004.
[11] K. L. Tan, C. H. Goh, and B. C. Ooi, "Online feedback for nested aggregate queries with multi-threading," in Proc. of the 25th VLDB Conf., pp. 18-29, Sep. 1999.
[12] C. Y. Chan and Y. E. Ioannidis, "Hierarchichal prefix cubes for range-sum queris," in Proc. of the 25th VLDB Conf., pp. 675-686, Sep. 1999.
[13 ] ن. دانشپور، رويكرد جديد در بهنگا مسازي پايگاه پردازش تحليلي، پايان نامه. كارشناسي ارشد، دانشگاه صنعتي اميركبير، .
1381 [14] B. McGehee, Use SET STATISTICS IO and SET STATISTICS TIME to Help Tune Your SQL Server Queries, Pipelines Newsletter, Feb. 2005.
[15] A. Tsois and T. K. Sellis, "The generalized pre-grouping transformation: aggregate-query optimization in the presence of dependencise," in Proc. of the 29th VLDB Conf., vol. 29, pp. 644-655, Sep. 2003.
[16] R. Kaushik, R. Ramakrishnan, and V. T. Chakaravarthy, Synopses for Query Optimization: A Space - Complexity Perspective, ACM, PODS, pp. 201-209, 2004.
[17] F. Scarcello, G. Greco, and N. Leone, Weighted Hypertree Decompositions and Optimal Query Plans, ACM, PODS, pp. 210- 221, 2004.
[18] R. Chirkova, C. Li, and J. Li, "Answering queries using materialized views with minimum size," VLDB J., vol. 15, no. 3, pp. 191-210, Sep. 2006.
[19] S. Cohen, W. Nutt, and Y. Sagir, "Rewriting queries with arbitrary aggregation functions using views," ACM Trans. on DatabaseSystems, vol. 31, no. 2, pp. 672-715, Jun. 2006.

مقالات مرتبط

یک رهیافت فرااکتشافی چندهدفه برای بهبود پوشش و اتصال در شبکه‌های حسگر بی‌سیم
تاریخ چاپ : 1405/02/22
رویکرد ارزیابی هیجان نوین جهت مراقبت از سرطان مبتنی بر مدل‌های زبانی بزرگ
تاریخ چاپ : 1405/02/22
ارائه روشی برای مدیریت منابع در شبکه‌های Fog-DSDN با بهره‌گیری از معماری میکروسرویس و شبکه‌های ESN
تاریخ چاپ : 1405/02/22
چارچوب ترکیبی سبک‌وزن برای امنیت اینترنت اشیا با استفاده از جنگل تصادفی بهینه و انتخاب ویژگی تطبیقی در معماری لبه-ابری
تاریخ چاپ : 1405/02/22
یک چارچوب یادگیری نیمه‌نظارتی جهت دسته‌بندی دقیق موارد آزمون با بهره‌گیری از تعبیه‌های زبانی و ویژگی‌های معنایی متن
تاریخ چاپ : 1405/02/22
تکنیک هوشمند مبتنی بر الگوریتم چتر دریایی برای زمان‌بندی وظایف بر اساس اولویت در شبکه‌های IoT/Fog
تاریخ چاپ : 1405/02/22

اشتراک گذاری

آدرس مقاله

AUT - QPM: چارچوبی نو در ارزيابی پرس و جو براي تصميم‌گيري در ايجاد پايگاه داده تحليلي