Documentation

本手册详细说明了 cCCLE 数据库的数据生成流程、生物信息学管道以及用户操作指南。我们坚持所有步骤的透明化,以确保研究的可重复性。

01. Sample Collection

Source Confirmation: 所有用于多组学表征的细胞系均从官方细胞资源中心(如 ATCC, JCRB)直接引种。入库前均进行 STR(Short Tandem Repeat)鉴定,以确保基因型一致性。

Ethical Management: 实验过程严格遵循实验室生物安全二级(BSL-2)标准。样本处理过程中的所有原始记录均在 LIMS 系统中进行数字化管理,确保可追溯性。

02. Cell Culture & Processing

细胞培养工作在 ISO 7 级洁净室内进行。所有模型均使用预设的标准培养基(如 RPMI-1640 或 DMEM,添加 10% FBS)进行扩增。

Mycoplasma Testing: 每隔 4 周或在冻存前进行一次支原体 PCR 检测。只有检测结果为阴性的细胞系才会被送入测序流程。

Note: 详细的培养基配方和倍增时间数据可在样本详情页面的 "Metadata" 选项卡中下载。

03. Bioinformatics Pipeline

我们开发了名为 "cCCLE-Flow" 的标准化分析管道。该管道基于 Docker 容器构建,以保证在不同计算环境下的结果一致性。

Transcriptome Profiling (RNA-seq)

原始 Reads 经过 Fastp 质控后,使用 STAR (v2.7.10) 比对至参考基因组 GRCh38。表达量定量通过 RSEM 执行,并最终转换为 TPM 值。

Genomic Variant Calling (WES)

对于外显子组数据,遵循 GATK Best Practices 流程。使用 BWA-MEM 进行比对,并通过 MuTect2 识别体细胞突变(Somatic Mutations)。

04. Platform Tutorial

数据库提供以下核心功能模块:

  • Quick Search: 支持基因名、癌种或细胞系 ID 的模糊检索。
  • Omics Viewer: 交互式热图,支持自定义基因列表的动态聚类展示。
  • Download Hub: 用户可以按癌种或组学类型打包下载标准化后的矩阵文件。
Scroll to top