OPTICS (acronyme de ordering points to identify the clustering structure en anglais) est un algorithme de partitionnement de données. Il a été proposé par Mihael Ankerst, Markus M. Breunig, Hans-Peter Kriegel and Jörg Sander[1]. Il s'agit d'un algorithme basé densité dont le principe est similaire à DBSCAN mais élimine son principal défaut : l'impossibilité de détecter des partitions de densités différentes.

OPTICS
Type
Algorithme de partitionnement de données (d)Voir et modifier les données sur Wikidata

Principe général

modifier

Comme DBSCAN, OPTICS demande deux paramètres :  , définissant un rayon maximum à considérer, et  , définissant un nombre de points minimum. Ces 2 paramètres définissent donc une densité minimale pour constituer un groupe de données. Un point   appartient à un groupe si au moins   points existent dans son  -voisinage  . Par contre, à l'inverse de DBSCAN, le paramètre   est optionnel. S'il est omis, il sera alors considéré comme infini. L'algorithme définit pour chaque point une distance, appelée core distance, qui décrit la distance avec le  ème point le plus proche :

 

La reachability-distance du point   à un autre point   est la distance entre   et  , ou la core-distance de  :

 


La core-distance et la reachability-distance sont indéfinis si le groupe de points n'est pas suffisamment dense. Si   est suffisamment grand, cela n'arrive jamais, mais toutes les requêtes d' -voisinage retourneront l'ensemble des points, la complexité étant alors en  . Le paramètre   est donc utile pour définir une densité minimale afin d'accélérer l'algorithme.

Pseudocode

modifier
 OPTICS(DB, ε, MinPts)
    pour chaque point p de DB
       p.reachability-distance = INDÉFINI
    pour chaque point non visité p de DB
       N = voisinage(p, ε)
       marquer p comme visité
       émettre p dans la liste ordonnée
       si (core-distance(p, ε, Minpts) != INDÉFINI)
          Seeds = queue prioritaire vide
          modifier(N, p, Seeds, ε, Minpts)
          pour chaque q prioritaire dans Seeds
             N' = voisinage(q, ε)
             marquer q comme visité
             émettre q dans la liste ordonnée
             si (core-distance(q, ε, Minpts) != INDÉFINI)
                modifier(N', q, Seeds, ε, Minpts)


 modifier(N, p, Seeds, ε, Minpts)
    coredist = core-distance(p, ε, MinPts)
    pour chaque o dans N
       si (o n'a pas été visité)
          new-reach-dist = max(coredist, dist(p,o))
          si (o.reachability-distance == INDÉFINI)
              o.reachability-distance = new-reach-dist
              Seeds.insert(o, new-reach-dist)
          sinon
              si (new-reach-dist < o.reachability-distance)
                 o.reachability-distance = new-reach-dist
                 Seeds.move-up(o, new-reach-dist)

OPTICS fournit donc une liste ordonnée de point associés à leur plus petite reachability-distance.

Extraire les partitions

modifier

 

La sortie de l'algorithme permet de construire un diagramme appelé reachability-plot. C'est un diagramme en 2D dont l'axe x correspond à la position d'un point dans la liste ordonnée et l'axe y la reachability-distance associée à ce point. Les points d'un même cluster ont une reachability-distance assez basse, les vallées du diagramme représentent donc les différents clusters du jeu de données. Plus les vallées sont profondes, plus les clusters sont denses. L'image ci-dessus en montre le principe.

Références

modifier
  1. Mihael Ankerst, Markus M. Breunig, Hans-Peter Kriegel, Jörg Sander « OPTICS: Ordering Points To Identify the Clustering Structure » (1999) (lire en ligne)
    ACM SIGMOD international conference on Management of data

📚 Artikel Terkait di Wikipedia

DxO PhotoLab

d'images, accumulée pendant le développement des Optics Modules a servi de fondement aux algorithmes de DeepPRIME. Au lieu de traiter séparément le dématriçage

Algorithme quantique

En informatique quantique, un algorithme quantique est un algorithme qui s'exécute sur un modèle réaliste de calcul quantique ; le modèle le plus couramment

Partitionnement de données

tels que le modèle de mélange gaussien ; Des algorithmes basés sur la densité tels que DBSCAN ou OPTICS ; Des méthodes connexionnistes telles que les

Système de détection acoustique distribuée

scientifiques et implique donc un traitement en temps réel, par des algorithmes d'intelligence artificielle filtrant les données et construisant des

DxO

millions d'euros de financement en capital risque. Lorsque DO Labs a lancé DxO Optics Pro en 2004, devenu DxO PhotoLab en 2017, il s'agissait du premier produit

Shack-Hartmann

(fr) Imagine Optic ; (en) Metrolux GmbH ; (en) OPTOCRAFT GmbH ; (en) AKA Optics. (en)Robert Shannon and Roland Shack: Legends in Applied Optics sur Google

Neil Sloane

Codes, Elsevier/North-Holland, 1977 (en) (avec M Harwit) Hadamard Transform Optics, Academic Press, 1979 (en) (avec Aaron D. Wyner (en)) Claude Elwood Shannon:

Patrick Flandrin

des sciences 2001 : Wavelet Pioneer Award de l’International Society for Optics and Photonics (SPIE) 2002 : Fellow de l’Institute of Electrical and Electronics