ITHEA International Scientific Society : METHOD OF DATA ANALYSIS BASED ON CLUSTERING IN “SYNDROMES” INDICATORS SPACE

ITHEA Classification Structure > G. Mathematics of Computing > G.3 PROBABILITY AND STATISTICS
ITHEA Classification Structure > H. Information Systems > H.2 DATABASE MANAGEMENT > H.2.8 Database Applications

METHOD OF DATA ANALYSIS BASED ON CLUSTERING IN “SYNDROMES” INDICATORS SPACE
By: Senko Oleg, Kuznetsova Anna, Kostomarova Irina (4348 reads)

Rating:

(1.00/10)

Abstract: A new data analysis method is discussed that is based on calculating syndromes by training data sets. Syndrome are defined as sub-regions in feature space where mean values of target Y deviates from mean value of Y in whole data set. Described method of syndromes construction uses boundaries found with the help of modified version of optimal valid partitioning (OVP) method. The modification is based on new validation technique that allows more effectively delete redundant regularities from output set. OVP boundaries are used to find sub-regions in features space with strong deviation of target Y from its mean by whole data set. Such subregions further are called syndromes. Hierarchical tree method was applied to receive clusters of objects from training dataset in space of binary indices indicating if feature description of object belongs to corresponding syndrome. Such technique allows discovering sets of objects with similar syndromes. Experiments with biomedical datasets are discussed.

Keywords: Optimal partitioning, statistical validity, permutation test, regularities, gerontology.

ACM Classification Keywords: H.2.8 Database Applications - Data mining, G.3 Probability and Statistics - Nonparametric statistics, Probabilistic algorithms

Link:

METHOD OF DATA ANALYSIS BASED ON CLUSTERING IN “SYNDROMES” INDICATORS SPACE

Senko Oleg, Kuznetsova Anna, Kostomarova Irina

http://www.foibg.com/ijitk/ijitk-vol07/ijitk07-04-p07.pdf

Print

G.3 PROBABILITY AND STATISTICS

article: DECISION-MAKING IN GROUPS OF INTERVAL ALTERNATIVES · RISK BEHAVIOUR IN A SET OF INTERVAL ALTERNATIVES · Peculiarities Analysis of Statistical Information in ICT · About convergence of fuzzy perceptive elements sequences, defined on ... · INFORMATION SYSTEM OF FORECASTING BASED ON COMBINED MODELS WITH TIME SERIES ... · Integrated Approach to the Study of Fractal Time Series · METHOD OF DATA ANALYSIS BASED ON CLUSTERING IN “SYNDROMES” INDICATORS SPACE · MATRIXES LEAST SQUARES METHOD AND EXAMPLES OF ITS APPLICATION · PHYSICAL PHENOMENON OF STATISTICAL STABILITY · ANALYSIS OF FEATURES AND POSSIBILITIES OF BANK FUNCTIONING EFFICIENCY BASED ... · SUB-OPTIMAL NONPARAMETRIC HYPOTHESES DISCRIMINATING WITH GUARANTEED DECISION · Solution of the Problem of Formal Evaluation of Effectiveness of ... · ANALYSIS OF THE PROPERTIES OF ORDINARY LEVY MOTION BASED ON THE ESTIMATION ... · SPREADING THE MOORE - PENROSE PSEUDO INVERSE ON MATRICES EUCLIDEAN SPACES: ... · Evaluating Expected Effectiveness of Interval Alternatives · · EVALUATING EXPECTED EFFECTIVENESS OF INTERVAL ALTERNATIVES · COMPARISON OF DIFFERENT WAVELET BASES IN THE CASE OF WAVELETS EXPANSIONS... · О ПРИМЕНИМОСТИ ОЦЕНКО МАТЕМАТИЧЕСКОГО ОЖИД · VECTORS AND MATRIXES LEAST SQUARES METHOD: FOUNDATION AND APPLICATION ... · VECTORS AND MATRIXES IN GROUPING INFORMATION PROBLEM · ОЦЕНКА ИНТЕРВАЛЬНЫХ АЛЬТЕРНАТИВ:... · ON SOME PROPERTIES OF REGRESSION MODELS BASED ON CORRELATION MAXIMIZATION ... · RECURRENT PROCEDURE IN SOLVING THE GROUPING INFORMATION PROBLEM IN APPLIED... · DIVERGENT AND MULTIPLE-VALUED SEQUENCES AND FUNCTIONS · ‘FEATURE VECTORS’ IN GROUPING INFORMATION PROBLEM IN APPLIED MATHEMATICS: .. · MODELING TELECOMMUNICATIONS TRAFFIC USING THE STOCHASTIC MULTIFRACTAL CASCADE... · INTERVALS AS ULTRAMETRIC APPROXIMATIONS ACCORDING TO THE SUPREMUM NORM · DIFFERENTIAL GEOMETRY DERIVED FROM DIVERGENCE FUNCTIONS... · COMPARATIVE ANALYSIS FOR ESTIMATING OF THE HURST EXPONET FOR STATIONARY AND ... · DISTURBANCE OF STATISTICAL STABILITY (PART II) · FUZZY SETS AS A MEAN FOR UNCERTAINTY HANDLING: MATH, APPLIED MATH, HEURISTICS · FUZZY SETS: MATH, APPLIED MATH, HEURISTICS? PROBLEMS AND INTERPRETATIONS · СИММЕТРИЯ В ЗАПИСИ ГЕНЕТИЧЕСКОЙ ИНФОРМАЦИИ · ЕВКЛИДОВЫ ПРОСТРАНСТВА ЧИСЛОВЫХ ВЕКТОРОВ И · METHOD FOR EVALUATING OF DISCREPANCY BETWEEN REGULARITIES SYSTEMS IN ... · CORRELATION MAXIMIZATION IN REGRESSION MODELS BASED ON CONVEX COMBINATIONS · NEURAL NETWORK SEGMENTATION OF VIDEO VIA TIME SERIES ANALYSIS · GOD-ICS. ON FUNDAMENTAL INFORMATION FIELD QUEST · ОЦЕНИВАНИЕ РИСКА РЕГРЕССИОННОЙ МОДЕЛИ В СЛ� · ПОСТРОЕНИЕ ЛОГИКО-ВЕРОЯТНОСТНЫХ МОДЕЛЕЙ В� · ОПТИМИЗАЦИЯ ОЦЕНКИ ВЕРОЯТНОСТИ ОШИБОЧНОЙ К · ON A PROBLEM OF QOS CHARACTERISTICS INTERPRETATION IN TRANSIT NETWORKS · OPTIMAL FORECASTING BASED ON CONVEXCORRECTING PROCEDURES · COMPARATIVE ANALYSIS OF STATISTICAL PROPERTIES OF THE HURST EXPONENT ... · DISTURBANCE OF STATISTICAL STABILITY · A SURVEY OF NONPARAMETRIC TESTS FOR THE STATISTICAL ANALYSIS OF EVOLUTIONARY ... · COGNITION HORIZON AND THE THEORY OF HYPER-RANDOM PHENOMENA · IMPROVED CRYPTOANALYSIS OF THE SELF-SHRINKING ... · EVALUATION OF PARETO/D/1/K QUEUE BY SIMULATION · N A PROBLEM OF QOS CHARACTERISTICS INTERPRETATION IN TRANSIT NETWORKS · APPLICATION OF THE HETEROGENEOUS SYSTEM PREDICTION METHOD · STUDY OF QUEUEING BEHAVIOUR IN IP BUFFERS · EXTREME SITUATIONS PREDICTION BY MULTIDIMENSIONAL HETEROGENEOUS ... · APPLICATION OF THE MULTIVARIATE PREDICTION METHOD TO TIME SERIES 1 · DETECTION OF LOGICAL-AND-PROBABILISTIC CORRELATION IN TIME SERIES1 ·

H.2.8 Database Applications

article: STORING INFORMATION VIA NATURAL LANGUAGE ADDRESSING – A STEP TOWARD MODELING ... · ALGORITHM FOR QUICK NUMBERING OF LARGE VOLUMES OF DATA · RDFARM - A SYSTEM FOR STORING LARGE SETS OF RDF TRIPLES AND QUADRUPLES BY ... · SELF-CITATIONS EFFECT ON SCIENTOMETRIC INDEXES · SHAPING THE CITATION-PAPER RANK DISTRIBUTIONS: BEYOND HIRSCH’S MODEL · ONTOARM - A SYSTEM FOR STORING ONTOLOGIES BY NATURAL LANGUAGE ADDRESSING · METHOD OF DATA ANALYSIS BASED ON CLUSTERING IN “SYNDROMES” INDICATORS SPACE · ANALYZING THE LOCALIZATION OF LANGUAGE FEATURES WITH COMPLEX SYSTEMS TOOLS ... · WORDARM - A SYSTEM FOR STORING DICTIONARIES AND THESAURUSES BY ... · ASSOCIATION RULE MINING WITH N-DIMENSIONAL UNIT CUBE CHAIN SPLIT TECHNIQUE · ON A METHOD OF MULTI-ALGORITHMIC CLASSIFICATION · PROCESSING SETS OF CLASSES’ LOGICAL REGULARITIES · CITATION-PAPER RANK DISTRIBUTIONS AND ASSOCIATED SCIENTOMETRIC INDICATORS ... · MULTI-VARIANT PYRAMIDAL CLUSTERING AND ANALYSIS HIGH-DIMENSIONAL DATA · THEORETICAL ANALYSIS OF EMPIRICAL RELATIONSHIPS FOR PARETODISTRIBUTED... · INTEGRATED ENVIRONMENT FOR STORING AND HANDLING INFORMATION IN TASKS OF ... · ABOUT MULTI-VARIANT CLUSTERING AND ANALYSIS HIGH-DIMENSIONAL DATA · COMPUTATIONAL MODEL FOR SERENDIPITY · METHOD FOR EVALUATING OF DISCREPANCY BETWEEN REGULARITIES SYSTEMS IN ... · ASTRONOMICAL PLATES SPECTRA EXTRACTION OBJECTIVES AND POSSIBLE SOLUTIONS ... · METHODS OF REGULARITIES SEARCHING BASED ON OPTIMAL PARTITIONING · AN APPROACH TO VARIABLE AGGREGATION IN EFFICIENCY ANALYSIS · INDIRECT SPATIAL DATA EXTRACTION FROM WEB DOCUMENTS · METHODS FOR EVALUATING OF REGULARITIES SYSTEMS STRUCTURE · COMPOSITE BLOCK OPTIMIZED CLASSIFICATION DATA STRUCTURES · INDIRECT SPATIAL DATA EXTRACTION FROM WEB DOCUMENTS · INDIRECT SPATIAL DATA EXTRACTION FROM WEB DOCUMENTS · HOW TO USE A DESKTOP VERSION OF A DBMS FOR CLIENT-SERVER APPLICATIONS · DEVELOPMENT OF DATABASE FOR DISTRIBUTED INFORMATION MEASUREMENT ... · THE DEVELOPMENT OF THE GENERALIZATION ALGORITHM BASED ON THE ROUGH SET THEORY · THE ROLE OF DBMS IN ANALYTICAL PROCESSES OF THE LOGISTIC ·

Login

World Clock

Powered by Tikiwiki

Powered by PHP

Powered by Smarty

Powered by ADOdb

Made with CSS

Powered by RDF

powered by The PHP Layers Menu System

Wiki

Blogs

Articles

Image Galleries

File Galleries

Forums

Maps

Calendars

[ Execution time: 0.08 secs ] [ Memory usage: 7.58MB ] [ GZIP Disabled ] [ Server load: 0.30 ]

Powered by Tikiwiki CMS/Groupware