Carregant...
Fitxers
Tipus de document
ArticleVersió
Versió acceptadaData de publicació
Tots els drets reservats
Si us plau utilitzeu sempre aquest identificador per citar o enllaçar aquest document: https://hdl.handle.net/2445/138985
Structuring chemical space: similarity-based characterization of the PubChem Database
Títol de la revista
Director/Tutor
ISSN de la revista
Títol del volum
Recurs relacionat
Resum
The ensemble of conceivable molecules is referred to as the Chemical Space. In this article we describe a hierarchical version of the Affinity Propagation (AP) clustering algorithm and apply it to analyze the LINGO‐based similarity matrix of a 500 000‐molecule subset of the PubChem database, which contains more than 19 million compounds. The combination of two highly efficient methods, namely the AP clustering algorithm and LINGO‐based molecular similarity calculations, allows the unbiased analysis of large databases. Hierarchical clustering generates a numerical diagonalization of the similarity matrix. The target‐independent, intrinsic structure of the database , derived without any previous information on the physical or biological properties of the compounds, maps together molecules experimentally shown to bind the same biological target or to have similar physical properties
Matèries
Matèries (anglès)
Citació
Citació
CINCILLA, Giovanni, THORMANN, Michael, PONS VALLÈS, Miquel. Structuring chemical space: similarity-based characterization of the PubChem Database. _Molecular Informatics_. 2010. Vol. 29, núm. 1-2, pàgs. 37-49. [consulta: 14 de gener de 2026]. ISSN: 1868-1743. [Disponible a: https://hdl.handle.net/2445/138985]