查看原文
其他

多个10x单细胞转录组每个样品的3个文件如何归纳到同一个文件夹里面

生信技能树 生信技能树 2022-08-15

我们以PNAS杂志的一个关于AD的单细胞的数据集, https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE157827 为例子,它有 21个10x样品哦,总计是 169,496 nuclei 单细胞,大家可以去下载它的文件:会得到如下所示:

  32K  9  3  2020 GSM4775561_AD1_barcodes.tsv.gz
  298K  9  3  2020 GSM4775561_AD1_features.tsv.gz
   53M  9  3  2020 GSM4775561_AD1_matrix.mtx.gz
   74K  9  3  2020 GSM4775562_AD2_barcodes.tsv.gz
  298K  9  3  2020 GSM4775562_AD2_features.tsv.gz
  115M  9  3  2020 GSM4775562_AD2_matrix.mtx.gz
   32K  9  3  2020 GSM4775563_AD4_barcodes.tsv.gz
  298K  9  3  2020 GSM4775563_AD4_features.tsv.gz
   33M  9  3  2020 GSM4775563_AD4_matrix.mtx.gz
   61K  9  3  2020 GSM4775564_AD5_barcodes.tsv.gz
  298K  9  3  2020 GSM4775564_AD5_features.tsv.gz
   70M  9  3  2020 GSM4775564_AD5_matrix.mtx.gz
   16K  9  3  2020 GSM4775565_AD6_barcodes.tsv.gz
  298K  9  3  2020 GSM4775565_AD6_features.tsv.gz
  5.6M  9  3  2020 GSM4775565_AD6_matrix.mtx.gz 

下游处理的时候这些文件时候,一定要保证每个样品的 3个文件同时存在,而且在同一个文件夹下面。示例代码是:

rm(list=ls())
options(stringsAsFactors = F)
library(Seurat)
sce1 <- CreateSeuratObject(Read10X('../10x-results/WT/'),
                          "wt")

重点就是 Read10X 函数读取 文件夹路径,比如:../10x-results/WT/ ,保证文件夹下面有3个文件。

其实如果样本量并不大,可以自己手动修改,如下所示,每个文件夹里面都是3个文件,而且文件名必须很纯净,保证是一样的:

 

但是如果样品数量很多,其实就可以使用代码批量进行修改啦!

微信扫一扫付费阅读本文

可试读42%

微信扫一扫付费阅读本文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存