Les bases de données dites hétérogènes contiennent des données décrites par des attributs à la fois symboliques et numériques. Cet article propose une méthode, appelée OSACA, pour identifier, parmi les attributs symboliques, les attributs ordinaux, en exploitant les informations fournies par les attributs numériques. Pour ce faire, OSACA procède en trois étapes : des motifs graduels sont d'abord extraits des attributs numériques. Des filtres morphologiques sont ensuite appliqués aux attributs symboliques pour déterminer des ordres sur les valeurs catégorielles à partir de l'ordre induit par les motifs graduels. Enfin, une mesure d'entropie d'ordre permet d'évaluer la pertinence des ordres candidats.
Dans cet article, une approche d'adaptation dynamique d'un arbre de décision flou est présentée et des résultats d'expérimentations sont donnés montrant l'intérêt et efficacité de cette approche. De plus, la capacité adaptabilité des arbres ainsi que les limites de cette approche sont étudiées.
Les tendances graduelles de la forme plus X est A, plus Y est B expriment linguistiquement des informations sur les corrélations et co-variations des attributs. Dans cet article, nous présentons une étude comparative des formalisations qui ont été proposées, examinant leurs sémantiques et propriétés respectives. Nous proposons ensuite un algorithme qui combine les principes de plusieurs approches existantes pour extraire efficacement les motifs graduels fréquents et nous illustrons son utilisation sur une base de données réelle. Gradual tendencies of the form the more X is A, the more Y is B linguistically express information about correlation between attributes and their covariations. In this paper, we present a comparative study of the various formalisations that have been proposed, studying their respective semantics and properties. We then propose an algorithm that combines the principles of existing approaches to efficiently extract frequent gradual itemsets, illustrating its use on a real data set.
Les motifs graduels, de la forme « plus/moins A, plus/moins B » extraient des connaissances sous la forme de corrélations entre attributs. Les méthodes d'extraction de tels motifs peuvent générer des motifs contradictoires, produisant par exemple simultanément les motifs « plus A, plus B » et « plus A, moins B ». Pour gérer ces contradictions, cet article propose une définition contrainte du support d'un motif graduel, qui, en particulier, ne dépend pas uniquement du motif considéré, mais aussi de ses contradicteurs potentiels. La pertinence de l'approche est illustrée sur des bases de données de l'UCI. Gradual patterns of the form « the more/less A, the more/less B » extract knowledge in the form of correlations between attributes. The methods for extracting such patterns can generate contradictory patterns, for example simultaneously producing the patterns « the more A, the more B » and « the more A, the less B ». To handle these contradictions, this paper proposes a constrained definition of a gradual support, which, in particular, does not only depend on the considered pattern, but also on its potential contradictors. The relevance of the approach is illustrated on UCI databases.
Les motifs graduels de la forme _ plus/moins A, plus/moins B _ résument et caractérisent des données par leurs tendances internes exprimées comme des corrélations entre les valeurs des attributs. Cet article propose dénrichir ces motifs graduels en prenant en compte un effet d'accélération, conduisant à un nouveau type de motifs graduels de la forme _ plus/moins A augmente, plus B augmente rapidement _. Il propose une interprétation comme contrainte de convexité imposée à la relation entre A et B et une formalisation de ces motifs graduels accélérés, ainsi que des critères d'évaluation. Il illustre la pertinence de l'approche proposée sur des données réelles. Gradual itemsets of the form _ the more/less A, the more/less B _ summarize data through the description of their internal tendencies, identified as correlation between attribute values. This paper proposes to enrich such gradual itemsets by taking into account an acceleration effect, leading to a new type of gradual itemset of the form _ the more/less A increases, the more quickly B increases _. It proposes an interpretation as a convexity constraint imposed on the relation between A and B and a formalization of these accelerated gradual itemsets, as well as evaluation criteria. It illustrates the relevance of the proposed approach on real data.
L'extraction de motifs émergents a pour objectif de souligner les caractéristiques distinctives d'une base de données par opposition à une base de référence, afin de mettre en évidence leurs différences. Cet article considère le cas particulier des motifs graduels émergents et vise, donc, à extraire des co-variations d'attributs discriminantes. Il discute les spécificités des motifs graduels nécessitant le développement d'une nouvelle méthode et propose la transposition adaptée d'un algorithme efficace basé sur la notion de bordure, en justifiant son applicabilité au cas des motifs graduels. Il illustre les résultats obtenus sur des données de l'UCI.