Esta notebook esta pensada para ilustrar el tipo de analisis que puede realizarse utilizando los conceptos introducido por Horvath y colaboradores en relacion al uso de Redes pesadas de correlacion (Weighted Gene Correlation Networks) para la caracterizacion y analisis de estados transcripcionales.
Para ilustrar los conceptos introducidos haremos uso de los datos RNAseq (GSE88798) presentados en el trabajo de Mine y colaboradores [Plant Cell 2018](http://www.plantcell.org/content/30/6/1199). El paper presenta un estudio transcripcional sobre los mecanismos de respuesta inmune en plantas (Arabidospis thaliana). Para ello analiza la dinamica transcripcional de plantas salvajes y knowouts de diferentes componentes moleculares involucrados en dos tipos de respuesta: pattern-triggered immunity (PTY) y effector-triggered immunity (ETI). En ambos casos se realizan ensayos utilizando alternativamente placebo, cepas virulentas y no-virulentas sobre distintos background geneticos. Nosotros nos concentraremos en los experimentos realizados sobre plantas wild-type
Aqui esta el abstract del trabajo:
###### *The phytohormone network consisting of jasmonate, ethylene, PHYTOALEXIN-DEFICIENT4, and salicylic acid signaling is
required for the two modes of plant immunity, pattern-triggered immunity (PTI), and effector-triggered immunity (ETI). A
previous study showed that during PTI, the transcriptional responses of over 5000 genes qualitatively depend on complex
interactions between the network components. However, the role of the network in transcriptional reprogramming during
ETI and whether it differs between PTI and ETI remain elusive. Here, we generated time-series RNA-sequencing data of
Arabidopsis thaliana wild-type and combinatorial mutant plants deficient in components of the network upon challenge with
virulent or ETI-triggering avirulent strains of the foliar bacterial pathogen Pseudomonas syringae. Resistant plants such as
the wild type achieved high-amplitude transcriptional reprogramming 4 h after challenge with avirulent strains and sustained
this transcriptome response. Strikingly, susceptible plants including the quadruple network mutant showed almost identical
transcriptome responses to resistant plants but with several hours delay. Furthermore, gene coexpression network structure
was highly conserved between the wild type and quadruple mutant. Thus, in contrast to PTI, the phytohormone network is
required only for achieving high-amplitude transcriptional reprogramming within the early time window of ETI against this
bacterial pathogen.*
La matriz de expresion que utilizaremos esta disponible en el archivo *GSE88798_ReadCountTable_M001_348.txt.gz* .
## Carga de datos
```{r}
data <- read.table(file="data/GSE88798_ReadCountTable_M001_348.txt.gz",header=TRUE,stringsAsFactors=FALSE)
#decodificamos los nombres de las samples para entender los fenotipos que disponemos
En esta parte nos focalizamos en el analisis de plantas salvajes sometidas a los diferentes tratamientos: *mock* (placebo), *AvrRpt2*, *AvrRpm1* (cepas avirulentas Pto DC3000, asociadas a respuesta inmune tipo *ETI* (effector-triggered immunity)) , y *EV* (virulent Pto DC3000)
```{r}
#Nos centramos en el analisis de Col + mock/AvrRpt2