13  DA - analyse de l’abondance des clusters - univar

L’analyse supervisée vise à identifier les différences entre les groupes expérimentaux. L’analyse de l’abondance différentielle (DA) identifie les clusters dont l’abondance change.

13.0.1 DA Tables Columns

Méthodes d’analyse de l’abondance différentielle

Les tableaux de sortie sont dérivés des méthodes du paquetage diffcyt Weber et al. (2019).

Les sorties edgeR sont générées par diffcyt-DA-edgeR, en utilisant le package edgeR Robinson, McCarthy, et Smyth (2010) . Les sorties VOOM proviennent de diffcyt-DA-voom, basé sur la méthode VOOM du paquet limma Ritchie et al. (2015) . GLMM outputs are produced by diffcyt-DA-GLMM, employing a GLMM approach detailled by Nowicka et al. (2017).

Noms des colonnes de la sortie des tableaux d’abondance différentielle
Colonne Description
Référence Nom du groupe de référence ou de la condition utilisée pour la comparaison dans l’analyse d’abondance différentielle.
Contraste Nom du groupe ou de la condition de contraste comparé à la référence.
LogFC Log2 fold change des abondances moyennes du groupe de contraste par rapport au groupe de référence. Les valeurs positives indiquent une plus grande abondance dans le groupe de contraste, tandis que les valeurs négatives suggèrent une plus grande abondance dans le groupe de référence.
p_val Valeur P du test statistique utilisé pour déterminer la signification de la différence d’abondance des cellules entre le groupe de contraste et le groupe de référence. Une valeur P plus faible indique une différence plus significative sur le plan statistique.
p_adj Valeur P ajustée prenant en compte les corrections des tests multiples, fournissant une évaluation plus stricte de la signification.
FDR Taux de fausse découverte : valeur P ajustée tenant compte des comparaisons multiples, représentant la proportion attendue d’hypothèses faussement rejetées. La FDR est une correction complexe en théorie, mais elle est utilisée ici comme un outil de tri dans l’hypothèse de groupes d’étude de taille similaire.
Log2 CPM Le log2 des comptes par million, montrant le niveau d’abondance log-transformé, normalisé par les comptes totaux pour faciliter les comparaisons entre les échantillons de tailles différentes.
LR Statistique du rapport de vraisemblance, mesurant à quel point le modèle s’adapte aux données avec ou sans la variable d’intérêt.
AveExpr Abondance moyenne des cellules au sein de chaque groupe, sur l’ensemble des échantillons.
t La statistique t de l’analyse de l’abondance différentielle. Cette statistique évalue l’ampleur de la différence dans l’abondance des cellules par rapport à la variabilité.

13.0.2 Diagramme interactif des volcans et de l’abondance

Tracé interactif du volcan et de l’abondance

Tracé interactif du volcan et de l’abondance

13.0.2.1 tracé du volcan

Ce graphique interactif en forme de volcan est conçu pour visualiser les comparaisons différentielles d’abondance (DAC) entre les clusters. Il représente le log2(Fold Change) sur l’axe des abscisses par rapport au log10 négatif de la valeur p ajustée sur l’axe des ordonnées. La taille de chaque point sur le graphique représente le nombre de cellules associées à chaque groupe, fournissant ainsi une échelle visuelle de l’abondance.

Les différences significatives sont soulignées par des lignes pointillées rouges, et les seuils pour celles-ci sont déterminés par :

Un log2(Fold Change) absolu supérieur à un seuil spécifique (<cutoff FC>), Une valeur p ajustée inférieure à un certain seuil (<cutoff FDR>). Les utilisateurs peuvent interagir avec le graphique en passant la souris sur les points pour superposer des annotations supplémentaires.

13.0.2.2 Graphique d’abondance

Ce graphique illustre l’abondance des cellules par groupe, en se concentrant sur celles qui sont associées à des valeurs p ajustées faibles. L’axe des abscisses affiche le pourcentage moyen de cellules totales, les clusters dépassant 1 % étant mis en évidence. L’axe des y indique le log10 négatif de la valeur p ajustée.

La taille de chaque point correspond au nombre de cellules dans le cluster, ce qui permet de voir facilement quels clusters ont le plus de cellules. Les clusters répondant à des critères de signification spécifiques sont mises en évidence en rouge, selon :

un pourcentage moyen de cellules totales supérieur à 1 %, une valeur p ajustée inférieure à un seuil défini (<cutoff FDR>). En outre, lorsque l’utilisateur survole un point, les données du groupe correspondant sont simultanément mises en évidence sur ce graphique d’abondance et sur le graphique du volcan correspondant. Cette fonction interactive permet d’établir une corrélation entre les changements significatifs de l’abondance et leur signification statistique dans les deux représentations visuelles.

13.0.3 Diagramme du violon

graphique violon

graphique violon

Ce diagramme en forme de violon est conçu pour illustrer l’abondance relative des cellules dans différents groupes expérimentaux, avec des options de personnalisation dynamiques qui s’adaptent aux conditions définies par l’utilisateur (<condition>) et aux paramètres du lot (<batch>). Le graphique est marqué par une ligne pointillée rouge distinctive à l’abscisse zéro.

La couleur de chaque violon correspond à une condition spécifique, ce qui facilite les comparaisons visuelles rapides entre les groupes. La forme des points de données à l’intérieur de chaque violon peut varier, reflétant les conditions de lot spécifiées, ce qui aide à évaluer l’impact du lot sur l’abondance des cellules.

Les annotations de signification sont intégrées directement dans le tracé, catégorisant la signification statistique des différences observées entre les groupes sur la base des valeurs p ajustées (FDR). Les niveaux de signification sont codés visuellement comme suit :

  • **** : Hautement significatif (FDR ≤ 0.0001)
  • *** : Très significatif (0,0001 < FDR ≤ 0,001)
  • ** : Significatif (0.001 < FDR ≤ 0.01)
  • * : Modérément significatif (0.01 < FDR ≤ 0.05)
  • . : Suggestif (0.05 < FDR ≤ 0.1)

13.0.3.1 Diagrammes en violon supplémentaires pour les contrastes significatifs

Si plus d’un contraste de groupe présente des résultats significatifs sur la base du taux de fausse découverte (FDR) et du logarithme du changement de pli (logFC), un diagramme de violon supplémentaire est créé. Ce diagramme n’inclut que les groupes qui répondent à ces seuils de signification et d’ampleur de l’effet. Il permet de mettre clairement et rapidement en évidence les différences les plus importantes entre les groupes.

13.1 Résultats consensuels

13.1.1 Fréquences transformées en Arcsinh

heatmap abondance

Inspiration plotExprHeatmap Catalyseur

Abondance des clusters de consensus avec de la MFI associé

inspiré par plotMultiHeatmap de Catalyst et cytofast

Arcsinh Transformed Frequencies

Arcsinh Transformed Frequencies