dwdm [www.uandistar.org]

19
Data Warehousing & Data Mining 1. Which of the following is the most popularly available and rich information repositories? a. Temporal databases b. Relational databases c. Transactional databases d. spatial databases 2. Which of the following databases is used to store time- related data? a. Spatial databases b. Text databases c. Multimedia databases d. Temporal databases 3. From a DWH perspective, data mining can be viewed as an advanced stage of a. On-Line Transaction Processing b. On-Line Data Processing c. On-Line Analytical Processing d. On-Line Electronic Processing 4. A _ _ _ _ _ _ is a group of heterogeneous databases? a. Time series databases b. Object oriented databases c. Legacy databases d. Spatial databases 5. Spatial databases includes a. Legacy databases b. Time series databases c. Satellite image databases d. Temporal databases 6. Many people treat data mining as synonym for another popularly used term a. Knowledge Discovery in databases b. knowledge inventory in databases c. Knowledge acceptance in database s d. knowledge disposal in databases. 7. A database is a collection of a. Related data b. Interrelated data c. Irrelevant data d. Distributed data 8. A Relational database is a collection of a. tables b. events c. attributes d. values 9. A _ _ _ _ _ _ _ is a repository of information collected from multiple squares stored under a unified schema, and which usually resides at a single site. a. Data mining b. Database c. Data warehouse d. legacy databases 10. Which of the following databases is used to store image, audio, and video data? a. Heterogeneous databases b. Temporal databases c. Legacy databases d. Multimedia databases 11. What is the single dimensional association rule for the following predicatenotation, which in multidimensional association rule. Contains(T, "computer") == contains(T, "software") a. Computer == software b. Software == computer c. Software == computer d. Computer == software 12. Which of the following analysis attempt to identify attributes that do not contribute to the classification or prediction process? a. Cluster analysis b. Outlier analysis c. Relevance analysis d. Evolution analysis 13. Which of the following is a summarization of the general characteristics or features of a target class of data? a. Data discrimination b. Data characterization c. Data compression d. Meta data

Upload: jyothibellary2754

Post on 28-Oct-2014

49 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Dwdm [Www.uandistar.org]

Data Warehousing & Data Mining1. Which of the following is themost popularly available and richinformation repositories?a. Temporal databasesb. Relational databasesc. Transactional databasesd. spatial databases2. Which of the followingdatabases is used to store time-related data?a. Spatial databasesb. Text databasesc. Multimedia databasesd. Temporal databases3. From a DWH perspective, datamining can be viewed as anadvanced stageofa. On-Line Transaction Processingb. On-Line Data Processingc. On-Line Analytical Processingd. On-Line Electronic Processing4. A _ _ _ _ _ _ is a group ofheterogeneous databases?a. Time series databasesb. Object oriented databasesc. Legacy databasesd. Spatial databases5. Spatial databases includesa. Legacy databasesb. Time series databasesc. Satellite image databasesd. Temporal databases6. Many people treat data miningas synonym for another popularlyused terma. Knowledge Discovery indatabasesb. knowledge inventory in databasesc. Knowledge acceptance in databasesd. knowledge disposal in databases.

7. A database is a collection ofa. Related datab. Interrelated datac. Irrelevant datad. Distributed data8. A Relational database is acollection ofa. tablesb. eventsc. attributesd. values9. A _ _ _ _ _ _ _ is a repository ofinformation collected frommultiple squares stored under aunified schema, and which usuallyresides at a single site.a. Data miningb. Databasec. Data warehoused. legacy databases10. Which of the followingdatabases is used to store image,audio, and video data?a. Heterogeneous databasesb. Temporal databasesc. Legacy databasesd. Multimedia databases11. What is the single dimensionalassociation rule for the followingpredicatenotation, which inmultidimensional association rule.Contains(T, "computer") ==contains(T, "software")a. Computer == softwareb. Software == computerc. Software == computerd. Computer == software12. Which of the following analysisattempt to identify attributes that

do not contribute to theclassification or predictionprocess?a. Cluster analysisb. Outlier analysisc. Relevance analysisd. Evolution analysis13. Which of the following is a

summarization of the generalcharacteristics orfeatures of a target class of data?a. Data discriminationb. Data characterizationc. Data compressiond. Meta data14. _ _ _ _ _ _ _ is a comparison ofthe general features of target classdata

Page 2: Dwdm [Www.uandistar.org]

objects with general features ofobjects from one or a set ofcontrastingclasses.a. Data characterizationb. Data summarizationc. Data discriminationd. Meta data15. _ _ _ _ _ _ _ interestingnessmeasures are based on userbeliefs in thedata.a. Objectiveb. Descriptivec. Collectived. Subjective16. _ _ _ _ _ _ mining taskscharacterize the generalproperties of the data inthe databases.a. Descriptiveb. Predictivec. Metadatad. Data

17. _ _ _ _ _ mining tasks performinference on the current data inorder tomake predictions.a. Descriptiveb. Predictivec. Datad. Metadata18. The derived model may berepresented in the form ofa. ER modelb. Flow chartc. Decision treesd. DFD19. Which of the following is theclassification of data miningsystems?a. Summarizationb. Visualizationc. Discriminationd. Characterization20. _ _ _ _ _ _ _ analysis describesand models regularities or trendsforobjects whose behavior changesover time.a. Data evolutionb. Clusterc. Outlierd. Summarization21. Which of the following issuesrelation to the diversity ofdatabase type?a. Handling noisy or incomplete datab. Incorporation of backgroundknowledgec. Handling of relational andcomplex types of datad. Efficiency and scalability of datamining algorithms22. Which of the following is not

major issue in data mining?

a. Mining methodology and userinteraction issuesb. Performance issuesc. Issues relating to the diversity ofdatabase typesd. Issues relating to theMeasurement

23. Processing _ _ _ _ _ queries inoperational databases wouldsubstantiallydegrade the performance ofoperational tasks.a. On-Line Transaction Processingb. On-Line Electronic Processingc. On-Line Data Processingd. On-Line Analytical Processing24. An _ _ _ _ _ _ System typicallyadopts either a star or snow flakemodel

Page 3: Dwdm [Www.uandistar.org]

and subject oriented databasedesign.a. On-Line Transaction Processingb. On-Line Electronic Processingc. On-Line Analytical Processingd. On-Line Data Processing25. The access patterns of an _ _ __ system consist mainly of short,atomictransactions.a. On-Line Analytical Processingb. On-Line Transaction Processingc. On-Line Electronic Processingd. On-Line Data Processing26. Which of the followingapproach requires complexinformation filteringand integration processes andcompetes for resources withprocessing atlocal sources?a. Update-driven approachb. Integrate-driven approachc. Query-driven approach

27. Mining different kinds ofknowledge in databases is anissue ina. Performance issueb. Mining methodology and userinteraction issuesc. Diversity of database types issuesd. time complexity28. Pattern evolution is an issuerelated toa. Mining methodology and userinteraction issuesb. Performance issuesc. Issues relating to the diversity ofdatabase typesd. Issues relating to the Measurement29. A DWH is a subject oriented,integrated, time- variant, and _ _ ____collection of data in support ofmanagement's decision-makingprocess.a. Nonvolatileb. Volatilec. Disintegratedd. Object- oriented30. An _ _ _ system focusesmainly on the current data with inan enterpriseor department, without referring tohistorical data or data in differentorganizations .a. On-Line Analytical Processingb. On-Line Data Processingc. On-Line Electronic Processingd. On-Line Transaction Processing31. The basic characteristic of On-line Analytical Processing isa. Informational processingb. Operational processingc. Data processingd. Data cleaning

d. Data-driven approach

32. Which of the following cuboidthat holds the highest level ofsummerization?a. Cuboidb. Base cuboidc. Non-base cuboid

d. Apex coboid33. _ _ _ _ _ _ _ _ _ _ is avisualization operation that rotatesthe data axes inview in order to provide analternative presentation of the dataa. Rollupb. Drill downc. Pivot

Page 4: Dwdm [Www.uandistar.org]

d. Slice & dice34. _ _ _ _ _ _ tables can bespecified by users or experts, orautomaticallygenerated and adjusted based ondata distributions.a. Factb. Summarizedc. Dimensiond. Relational35. _ _ _ _ _ _ _ executes queriesinvolving more than one fact tablea. Drill-throughb. Drill-acrossc. Drill-downd. Rotate36. A _ _ _ _ _ allows data to bemodeled and viewed in multipledimensions.a. Meta datab. Data cubec. Databased. Fact table37. The major difference betweenthe snowflake and star schemamodels isthat the dimension tables of the

forma. Standardb. De-normalizedc. Normalizedd. Multi dimensional38. Which of the following is not ameasure, which is based on thekind ofaggregation functions used.a. Cumulativeb. Distributedc. Algebraicd. Holistic39. A concept hierarchy that is atotal or partial order amongattributes indatabase schema is called a _ _ __ _ _ _ _ _ _ _ hierarchy.a. Set-groupingb. Groupingc. Decisiond. Schema40. Which of the following focuseson socioeconomic applications?a. Statistical database systemsb. Online Analytical Processing systemsc. Spatial database systemsd. Temporal database systems41. A _ _ _ _ _ _ _ _ _ modelconsists of radial lines emanatingfrom a centralpoint, where each line representsa concept hierarchy for adimensiona. Cube netb. Triangle netc. Square netd. Star net42. Which of the following isconstructed where the enterprisewarehouse is

snowflake model image kept in _ ___

the sole custodian of allwarehouse data. Which is thendistributed to thevarious dependent data marts.a. Enterprise DWHb. Two- tier DWH

c. Multi-tier DWHd. Virtual warehouse43. Which of the following is aMulti Dimensional OnlineAnalytical Processing?a. Ess baseb. Databasec. Swiss based. Red brick

Page 5: Dwdm [Www.uandistar.org]

44. The _ _ _ _ _ _ view includesfact tables and dimension tables.a. DWHb. Top-downc. Data sourced. Business Query45. Which of the following is aHybrid OLAP server?a. MS SQL server 1.0b. MS SQL 5.0c. MS SQL server 7.0d. MS SQL server 3.046. ETL stands fora. Evaluate, Transport and Linkb. Extract Transfer and Loadc. Error, Tracking and Loadd. Extract, Transient and Load47. To architect the DWH, themajor driving factor to support isa. An inability to cope with requirementsevolutionb. Not populating the warehousec. Day- to- day management of thewarehoused. Supporting Online Transactionprocessing48. A _ _ _ _ _ _ _ contains asubset of corporate-wide data thatis of value to

a specific group of users.a. Enterprise warehouseb. Virtual warehousec. Data warehoused. Data mart49. A _ _ _ _ _ _ _ is a set of viewsover operational databasesa. Enterprise warehouseb. Virtual warehousec. Data warehoused. Data mart50. What kind of the intermediateservers that stand in between arelationalback-end server and client front-end tools?a. Hybrid OLAP serversb. Multidimensional OLAP serverc. Relational OLAP serversd. Specialized SQL servers51. Choose the _ _ _ _ _ _ _ _ _that will populate each fact tablerecorda. Measuresb. Dimensionsc. Graind. Business Process52. How many cuboids are there inan n- dimensional data cube?a.b.c.d.53. Meta data repository containsa. Operational meta datab. Data irrelevant to systemperformancec. The mapping from the DWH to theoperational environmentd. Summarized data54. Which of the following supportthe bitmap indicesa. Sybase IQ

b. Oracle 7c. CoBoL

Page 6: Dwdm [Www.uandistar.org]

d. SQL55. _ _ _ _ _ _ _ are created for thedata names and definitions of the

givenwarehousea. Data cubeb. Summarized datac. Meta datad. Detailed Information56. Chunking technique involves"overlapping" some of theaggregationcomputations, it is referred to as __ _ _ _ aggregation in data cubecomputationa. Two way arrayb. Three way arrayc. Multi way arrayd. Sparse array57. The _ _ _ _ _ _ _ operatorcomputes aggregates over allsubsets of thedimensions specified in theoperation.a. Data baseb. Computer cubec. Define cubed. Group by58. Which of the following is asubcuge that is small enough to fitinto thememory available for cubecomputation?a. Bulkb. Arrayc. Structured. Chunk59. The bit mapped join indicesmethod is an integrated form ofa. Composite join indexing and bitmapindexing

b. Join indexing and composite joinindexingc. Join indexing and bitmapindexingd. Bitmap indexing and outer joinindexing60. A set of attributes in a relationschema that forms a primary keyforanother relation schema is calleda_______a. Primary keyb. Foreign keyc. Secondary keyd. Composite key61. Which of the following typicallygathers data from multiple,heterogeneous, and externalsources?a. Data cleaningb. Loadc. Refreshd. Data extraction62. OLAM is particularly importantfor the following reasona. How quality of data in DWHb. Data processingc. OLTP-based exploratory dataanalysisd. Online selection of data miningfunctions63. Which of the following sets agood example for interactive dataanalysisand provides the necessarypreparations for exploratory datamining?a. OLPb. OLAPc. OLTPd. OLDP64. Which of the following is notexception indicator?

a. Out Expb. Self Expc. In Expd. Path Exp65. _ _ _ _ _ _ _ _ _ can help

business managers find and reachmore suitablecustomers, as well as gain criticalbusiness insights that may help todrivemarket share and raise profits.a. Data warehouseb. Data miningc. Data summarization

Page 7: Dwdm [Www.uandistar.org]

d. Data processing66. _ _ _ _ _ _ _ _ _ _ _ is analternative approach in which pre-computedmeasures indicating dataexceptions are used to guide theuser in the dataanalysis process at all levels ofaggregation.a. Hypothesis-driven explorationb. Inventory-driven explorationc. Discovery-driven explorationd. Exception-driven exploration67. Which of the following is anexception indicator that indicatesthatindicates the degree of surprise ofthe cell value, relative to othercells atthe same level of aggregation?a. Out Expb. In Expc. Path Expd. Self Exp68. _ _ _ _ _ is a powerfulparadigm that integrates OLAPwith data miningtechnology.a. Online Analytical Modelingb. Online Analytical Machine

c. Online Analytical Miningd. Online Analytical Monitoring69. Data warehouse application is_________a. Data Processingb. Transaction Processingc. Datacubed. Datamining70. _ _ _ _ _ _ _ _ _ cubes computecomplex queries involvingmultipledependent aggregates as multiplegranularitiesa. Multi featureb. Datac. Metad. Solid71. Which of the followingperforms a linear transformationon the originaldata?a. Z-score normalizationb. Normalization with decimal scalingc. Zero-standard deviationd. Min-max normalization72. Which of the following is thebest method for missing values indatacleaning?a. Fill in the missing value manuallyb. Use the most probable value tofill in the missing valuec. Use the attribute mean to fill themissing valued. Use a global constant to fill in themissing value73. The minimum and maximumvalues in a given bin are identifiedas thea. Bin meansb. Bin averagec. Bin mediansd. Bin boundaries

74. Which of the following is datatransformation operation?a. Normalizationb. Regressionc. Clustering

d. Binning75. The correlation betweenattributes A and B can bemeasured bya.b.c.d.76. _ _ _ _ _ methods smooth asorted data value by consulting in

Page 8: Dwdm [Www.uandistar.org]

neighborhood ie the valuesaround it.a. Clusteringb. Binningc. Regressiond. Data reduction77. Z-score normalization is alsocalled asa. Min-max normalizationb. Zero-standard deviation normalizationc. Zero-mean normalizationd. Normalization by decimal scaling78. _ _ _ _ _ _ is a random error orvariance in a measured variable.a. Binb. Clusterc. Noised. Regression79. The data are consolidated intoforms appropriate for mining iscalled asa. Data reductionb. Data Redundancyc. Data cleand. Data transformation80. Which of the following is adecision tree algorithm?a. C3.2b. ID3

c. PP2d. DIM81. If the tuples in D are groupedinto M mutually disjointClustering, then ansimple random sample of mclusters can be obtained, where mM whichof the following suits the abovesentence?a. Stratified sampleb. SRS without replacementc. Cluster sampled. SRS with replacement82. Multidimensional index treesincludea. A- treesb. T-treesc. P-treesd. R-trees83. Which of the following strategyfor data reduction is irrelevant,weaklyrelevant, or redundant attributesmay be detected and removed?a. Data cube aggregationb. Dimension reductionc. Data compressiond. Numerosity reduction84. In database systems, _ _ _ _ _are primarily used for providingfast dataaccess.a. Red-black treesb. Game treesc. Multidimensional index treesd. splay trees85. If the mining task isclassification, and the miningalgorithm itself is usedto determine the attribute subset,then this is called a _ _ _ _ _ _approach.

a. Filterb. Reductionc. Smoothingd. Wrapper

86. The discrete wavelettransformation is closely relatedto the _ _ _ _ _ _ _transform.a. Discrete fourierb. Fourierc. Laplaced. wavelet

Page 9: Dwdm [Www.uandistar.org]

87. Principal components analysisis also called asa. Karhunen-loeve methodb. Kinen-liva methodc. Kruskal-learn methodd. Kutni-lara method88. _ _ _ _ _ _ can be used as adata reduction technique since itallows alarge data set to be represented bya much smaller random subset ofthedata.a. Clusteringb. Regressionc. Histogramsd. Sampling89. Loy-linear models area. Parametric methodsb. Discrete methodsc. Non-parametric methodsd. Non- discrete methods90. Which of the following methodis the generation of concept ofhierarchiesfor categorical data?a. Specification of a portion of ahierarchy by implicit data groupingb. Specification of their partial ordering,but not of a set of attributes

c. Specification of a set ofattributes, but not of their partialorderd. Specification of only a partial set ofentities91. Which of the following methoduses class information?a. Histogram analysisb. Binningc. Cluster analysisd. Entropy-based Discretization92. _ _ _ _ _ _ _ _ _ hierarchies forcategorical attributes ordimensionstypically involve a group ofattributesa. Diccretizationb. Semanticc. Indexd. Concept93. Which of the following is basedon the maximal asset values,which maylead to a highly biased hierarchy?a. Cluster analysisb. Segmentationc. Binningd. Histogram analysis94. The _ _ _ _ _ can be used tosegment numeric data intorelatively uniform,"natural" intervals.a. 1-2-3 ruleb. 2-3-4 rulec. 3-4-5 ruled. 4-5-6rule95. _ _ _ _ _ _ _ _ hierarchies fornumeric attributes can beconstructedautomatically based on datadistribution analysis

a. Concept

b. Discretization

c. Treed. Index

96. _ _ _ _ _ _ _ techniques can be

used to reduce the number ofvalues for agiven continuous attribute, bydividing the range of the attributeintointervalsa. Concept hierarchyb. Discretizationc. Tree-basedd. Index97. A _ _ _ _ _ _ _ _ _ algorithmcan be applied to partition data

Page 10: Dwdm [Www.uandistar.org]

into groupsa. Binningb. Histogramc. Clusteringd. Entropy-based98. An information-based measurecalled _ _ _ _ can be used torecursivelypartition the values of a numericattribute A, resulting in ahierarchicaldiscretization.a. Entropyb. Clusterc. Binningd. Segmentation99. The kinds of knowledgeincludea. Image analysisb. Query processc. Associationd. Multimedia analysis100. Which of the following is asimplicity measure?a. Rule strengthb. Rule qualityc. Rule reliability

101. _ _ _ _ _ _ hierarchies can beused to refine or enrich schemadefinedhierarchies. When the two types ofhierarchies are combined.a. Schemab. Set-grouping

c. Operation-derivedd. rule-based102. _ _ _ _ _ _ _ are those thatcontribute new information orincreasedperformance to the given patternset.a. Utility patternsb. Certainty patternsc. Novelty patternd. Simplicity patterns103. Certainty factor is also knownasa. Rule lengthb. Noice thresholdc. Minable viewd. Rule strength104. Which of the followingprimitive specifies the data miningfunctions to beperformed?a. Task-relevant datab. The kind of knowledge to beminedc. Background knowledged. Interestingness measures105. _ _ _ _ _ _ _ may be used toguide the mining process or, afterdiscoveryto evaluate the discoveredpatterns.a. Task-relevant datab. The kind of knowledge to be minedc. Background knowledged. Interestingness measures

d. Rule length

106. A _ _ _ _ _ hierarchy is a totalor partial order among attributesin thedatabase schema.a. Schemab. Set-groupingc. Operation-derivedd. rule-based107. Given a set of task-relevantdata tuples the confidence of "A==B" isdefined asa.

b.c.d.108. _ _ _ _ _ hierarchies includethe decoding of informationencoded stringsinformation extraction fromcomplex data objects and dataclustering.a. Rule-basedb. Operation-derivedc. Schemad. Set grouping109. For association rules of theform "A== B" where A and B aresets ofitems, support is defined asa.b.

Page 11: Dwdm [Www.uandistar.org]

c.d.110. Which of the following clauseis the task-irrelevant dataprimitive?a. In relevance tob. Use for warehousec. Analysisd. Order by

111. Mining with the use of _ _ _ _ ,allows additional flexibility for adhocrule mining.a. Image patternsb. Data patternsc. Information patternsd. Meta patterns112. Which of the following clauselists the attributes or dimensionsforexplorationa. Order byb. group byc. havingd. in relevance to113. Which of the following clauseuses the meta pattern?a. Analyzeb. In relevance toc. Matchingd. Use data warehouse114. Which of the following clauseis used for discrimination?a. Mine characteristicsb. Mine discriminantc. Mine associationd. Mine comparison115. DMQL expansion isa. Data Modeling Queue Levelb. Design Modeling Query languagec. Data Mining Query Languaged. Data &Meta data Query Language116. The _ _ _ _ _ clause, whenused for characterization, specificaggregatemeasures, such as count, sum orcount .a. Use databaseb. Analyzec. Matchingd. Use hierarchy

117. Which of the following clausespecifies the condition by whichgroups ofdata are considered relevant?a. Having

b. Group byc. Order byd. analyze118. The _ _ _ _ _ _ _ _ statementis used to specify the kind ofknowledge tobe mined.a. Knowledge-mine-specificationb. Mine-knowledge-specification

Page 12: Dwdm [Www.uandistar.org]

c. Knowledge-specification-mined. Specification-mine-knowledge119. An example ofinterestingness measures andthreshold values isa. Without support threshold=b. With confidence threshold=c. Without Confidence threshold=d. With support threshold=120. CRISP-DM addresses anissue asa. Mapping from datamining problems tobusiness issuesb. Capturing and misunderstanding thedatac. Disintegrating datamining resultswithin the business contextd. Deploying and maintaining datamining results121. An Example of a set-groupinghierarchy isa. Define hierarchy age-hierarchy forage as customer on level1:{young,middleaged,serior} level10:all level2:{20 39} level1:young level2:{20 59}level1: middle-aged level2:{60 89}level1:senior

b. Define hierarchy age-hierarchy asage for customer on level1:{young,middleaged,serior} level10:all level2:{20 39} level1:young level2:{20 59}level1: middle-aged level2:{60 89}level1:seniorc. Define hierarchy age-hierarchyfor age on customer aslevel1:{young,middle-aged,serior} level10:alllevel2:{20 39} level1: younglevel2:{20 59} level1: middle-agedlevel2:{60 89} level1:seniord. Define hierarchy age-hierarchy onage for customer as level1:{young,middleaged,serior} level10:all level2:{20 39} level1:young level2:{20 59}level1: middle-aged level2:{60 89}level1:senior122. Which of the following datamining language uses SQL-likesyntax andserves as rule generation queriesfor mining association rules.a. MINE RULE operatorb. RULE MINE operatorc. DATA MINE operatord. DWH operator123. Which of the following is nota data mining language?a. DMQLb. MSQLc. PSQLd. OLE DB for124. System of schema hierarchyisa. textbf{Define hierarchy}location-hierarchy textbf{on}addresstextbf{as} [street, city, country]b. textbf{Define hierarchy} location-

ierarchy textbf{as} address textbf{on}

street, city, country]

c. textbf{Define hierarchy} location-hierarchy textbf{from} address textbf{to}[street, city, country]d. textbf{Define hierarchy }location-hierarchy textbf{for} address textbf{all}[street, city, country]

125. The DMQL statement syntaxisa. display as result _ fromb. display result _ fromc. display on result _ fromd. display for result _ from126. Which of the following is adata mining query languagea. PSQLb. QSQL

Page 13: Dwdm [Www.uandistar.org]

c. MSQLd. RSQL127. _ _ _ _ _ is used for efficientimplementations of a few essentialdatamining primitives.a. No couplingb. Loose couplingc. Tight couplingd. Semi tight coupling128. _ _ _ _ _ _ _ is a compromisebetween loose and tight coupling.a. No couplingb. Loose couplingc. Tight couplingd. Semi tight coupling129. Which of the followingcoupling schema is used to fetchdata from a datarepository managed by databasesystems?a. No couplingb. Loose couplingc. Tight couplingd. Semi tight coupling

130. A well designed data miningsystem should offer _ _ _ _ _ _ _with adata warehouse systema. Semi tight couplingb. No couplingc. Loose couplingd. Normal coupling131. Which of the following isdifficult to achieve high scalabilityand goodperformance with large data sets?a. No couplingb. Tight couplingc. Semi tight couplingd. Loose coupling132. _ _ _ _ _ _ _ _ means that aData mining system will not utilizeanyfunction of a data warehousesystema. Loose couplingb. Semi tight couplingc. Loose couplingd. No coupling133. _ _ _ _ _ _ _ _ means that adata mining system is smoothingintegratedcoupling database system.a. No couplingb. Loose couplingc. Tight couplingd. Semi tight coupling134. Which of the followingprovides a concise and succinctsummerization ofthe given collection of data?a. Comparisonb. Characterizationc. Summerizationd. Aggregation135. _ _ _ _ _ _ _ _ data mining

describes the data set in a concise

and

summerative manner and presentsinteresting general properties ofthedata.a. Descriptive

b. Predictivec. Actived. Constructive136. _ _ _ _ _ _ data mininganalyzes the data in order toconstruct one or aset of models and attempts topredict the behavior of new datasets.a. Descriptiveb. Predictive

Page 14: Dwdm [Www.uandistar.org]

c. Actived. Constructive137. Attribute removal is based onthe following rule: If there is alarge set ofdistinct values for an attribute ofthe initial working relation but,a. There is generalization operator onthe attributeb. There is no generalization operand onthe attributec. There is no generalizationoperator on the attributed. There is no aggregation operator onthe attribute138. On-line analysis processingin data warehouses is a purely-controlledprocessa. Machineb. databasec. Developerd. User139. Which of the followingapproach is used to controlgeneralization

a. Generalized relation thresholdcontrolb. Generalized class threshold controlc. Generalized dimension thresholdcontrold. Generalized query threshold control140. Many current OLAP systemsconfine dimensions to _ _ _ _ _ _ ____dataa. Numericb. Non numericc. Metad. Summerized141. _ _ _ _ _ _ _ is a process thatabstracts a large set of task-relevant datain a database from a relatively lowconceptual level to higherconceptuallevels.a. Data realizationb. Data characterizationc. Data summerizationd. Data generalization142. The _ _ _ _ _ _ approach canbe considered as a datawarehouse-basedpre-computation-oriented,material- view approach.a. Object-oriented inductionb. Data cubec. Attribute-oriented inductiond. Data square143. Which of the followingapproach is a relational databasequery-oriented,generalization-based, on-line dataanalysis technique?a. Attribute-oriented inductionb. object-oriented approachc. Data cubed. Data square

process?

144. _ _ _ _ _ _ _ _ performs off-line aggregation before an OLAPor Datamining query is submitted forprocessing.a. Object-oriented inductionb. Data cube

c. Attribute-oriented inductiond. Data square145. The range of t-weight isa.b.c.d.146. How can the t-weight andinterestingness measures ingeneral be used

Page 15: Dwdm [Www.uandistar.org]

by the data mining system todisplay only the conceptdescriptions that itobjectively evaluates asinteresting?a. By thresholdb. By generalizationc. By comparisond. By characterization147. The data cube implementationof attribute-oriented induction canbeperformed bya. Using defined data cubeb. Using a predefined data cubec. Using a generalized data cubed. Using a quantified data cube148. A _ _ _ _ _ can be representedby a 3-D data cube.a. Cross-tabb. Bar chartc. pie chartd. Flow chart149. Step one of the attribute-oriented-induction algorithm isessentially a

relational query to collect the taskrelevant data into the _ _ _ _ _ _ _____.a. Prime relationb. Secondary relationc. Working relationd. Analyzing relation150. Which of the followingrelation collects the statistics ofattributeorientedinductionalgorithm?a. Working relationb. Prime relationc. Secondary relationd. Analyzing realation151. Descriptions can also bevisualized in the form of _ _ _ _ _ ___.a. Cross-ralationsb. Cross-checksc. Cross-boardsd. Cross-tabs152. Step three of attribute-oriented-induction derives the _ ______relation.a. Workingb. Primec. Secondaryd. Analysing153. The _ _ _ _ _ _ as aninterestingness measure thatdescribes thetypically of each disjoint in therule, or of each tuple in thecorrespondinggeneralized relation.a. Quantitative ruleb. Quantitative characteristic rulec. c-weightd. t-weight154. The information gain isobtained by

a. Expected information + entropyb. Entropy - Expected informationc. Expected information entropyd. Entropy Expected information155. The expected information

needed to classify a given sampleisa. I(s1,s2----.sm)= mathop Sigmalimits_{i = 1}n ( /s) ( /s)b. I(s1,s2----.sm)= ( /s) ( /s)c. I(s1,s2----.sm)= - mathop Sigmalimits_{i = 1}n ( /s) ( /s)d. I(s1,s2----.sm)=- mathop Sigmalimits_{i = 1}n ( /s) ( /s)

Page 16: Dwdm [Www.uandistar.org]

156. Class comprarison is alsocalled asa. compositionb. aggregationc. discriminationd. characterization157. _ _ _ _ _ _ can be used toperform some preliminaryrelevance analysis on the data byremoving or generalizingattributes having a very largenumber of distinct values.a. Object-oriented inductionb. Attribute-oriented inductionc. Batch-oriented inductiond. Class-oriented induction158. Class characterization thatincludes the analysis ofattribute/dimensions relevance iscalled _ _ _ _ _ .a. Analytical comparisonb. Analytical measurementc. Analytical characterizationd. Analytical difference159. _ _ _ _ _ _ _ irrelevant andweakly relevant attributes usingthe selected relevance analysismeasure.a. Insertb. Update

c. Modifyd. Remove160. The _ _ _ _ _ class is theclass to be characterizeda. baseb. targetc. contrastingd. sub161. The _ _ _ _ _ _ class is the setof comparable data that are not inthetarget class.a. baseb. targetc. contrastingd. sub162. Generalization is performedon the _ _ _ _ _ _ _ _ to the levelcontrolledby a user or expert-specifieddimension threshold, whichresults in a _ _ _ ____a. Target class, Prime target classrelationb. Contrasting class, Prime contrastingclass relationc. Target class, Secondary target classrelationd. Contrasting class, Secondarycontrasting class relation163. Let be a generalized tuple,and be the target class, the d-weightis defined asa. d-weight =condition( ) / count( )b. d-weight =condition( ) / mathopSigma limits_{i = 1}m count( )c. d-weight =condition( ) / count( )d. d-weight =condition( ) / count( )164. Can class comparison miningbe implemented efficiently usingdata cube techniques?a. yes

b. noc. limitedd. difficult165. Class discrimination is alsocalled as

a. class comparisonb. class hierarchyc. class aggregationd. class concept166. The set of relevant data in thedatabase is collected by queryprocessedand is partitioned respectively into

Page 17: Dwdm [Www.uandistar.org]

a target class and one or a set of _____ class(es)a. discriminationb. contrastingc. comparabled. target167. The range for the d-weight isa.b.c.d.168. A _ _ _ _ _ _ d-weight in thetarget class indicates that theconcept represented by thegeneralized tuple is primarilyderived from the target classa. Lowb. Highc. Averaged. Middle169. A _ _ _ _ _ _ d-weight impliesthat the concept is primarilyderived from the contrasting classa. Lowb. Highc. Averaged. Middle170. A quantitave discriminant rulefor the target class of a given

comparison description is writtenin the forma. x, target _ class(x) compare(x) [d: d-weight]b. x, contrasting _ class(x) condition(x)[d: d-weight]c. x, contrasting _ class(x)compare(x) [d: d-weight]d. x, target _ class(x) condition(x) [d: d-weight]171. In d-weight, d stands fora. divideb. deadc. discriminationd. degree172. Inter quartile is defined asa. First quartile -Third quartileb. First quartile + Third quartilec. Third quartile + First quartiled. Third quartile - First quartile173. One common rule of thumbfor identifying suspected outliersis to singleout values falling at least _ _ _ _ __ _ above the third quartile orbelow the first quartile.a.b.c.d.174. The most commonly usedpercentiles other the median are ______a. Outliersb. Boxplotsc. Quartilesd. Modes175. A popularly used visualrepresentation of a distribution isthe _ _ _ _ _ _a. Boxplotb. Outlierc. Quartiled. Histogram

176. Dispersion is also called asa. Meanb. Variancec. Mediand. mode177. Which of the following iscentral tendency measure?a. Outliers

b. Variancec. Quartilesd. Mode178. Which of the following is adata dispersion measure?a. Meanb. Variancec. Moded. Median

Page 18: Dwdm [Www.uandistar.org]

179. The average of the largestand smallest values in a data setis called asa. Medianb. Meanc. Mid ranged. Mode180. The _ _ _ _ _ _ _ _ for a set ofdata is the value that occurs mostfrequently in the set.a. Medianb. Meanc. Mid ranged. Mode181. Which of the following is notcentral tendency measure?a. Varianceb. Meanc. Mediand. Mode182. A _ _ _ _ _ _ _ _ is one of themost effective graphical methodsor trend between two quantitativevariables.a. q-q plot

c. quantile plotd. q-q-q plot183. A _ _ _ _ _ _ _ _ is anotherimportant exploratory graphic aidthat adds a smooth curve to ascatter plot in order to providebetter perception of thepattern of dependence.a. Loess curveb. Scatter curvec. Bar chatd. Quantile plot184. Histograms are also called as_ _ _ _ _ _ _ _ _ histograms.a. frequencyb. variancec. quartiled. outlier185. The word loess is short fora. Load compressionb. Local compressionc. Load refressiond. Local refression186. A _ _ _ _ _ _ _ _ _ consists ofa set of rectangles that reflect thecounts of the classes present inthe given data.a. Quartile plotb. q-q plotc. Histogramd. Loess curves187. A _ _ _ _ _ _ is a simple andeffective way to have a first look atanunvariate data distribution.a. q-q plotb. scatter plotc. histogramd. quantile plot

b. scatter plot against the correspondingsquantiles of another.

Page 19: Dwdm [Www.uandistar.org]