Documentation

本手册详细说明了 cCCLE 数据库的数据生成流程、生物信息学管道以及用户操作指南。我们坚持所有步骤的透明化，以确保研究的可重复性。

01. Sample Collection

Source Confirmation: 所有用于多组学表征的细胞系均从官方细胞资源中心（如 ATCC, JCRB）直接引种。入库前均进行 STR（Short Tandem Repeat）鉴定，以确保基因型一致性。

Ethical Management: 实验过程严格遵循实验室生物安全二级（BSL-2）标准。样本处理过程中的所有原始记录均在 LIMS 系统中进行数字化管理，确保可追溯性。

细胞培养工作在 ISO 7 级洁净室内进行。所有模型均使用预设的标准培养基（如 RPMI-1640 或 DMEM，添加 10% FBS）进行扩增。

Mycoplasma Testing: 每隔 4 周或在冻存前进行一次支原体 PCR 检测。只有检测结果为阴性的细胞系才会被送入测序流程。

Note: 详细的培养基配方和倍增时间数据可在样本详情页面的 "Metadata" 选项卡中下载。

我们开发了名为 "cCCLE-Flow" 的标准化分析管道。该管道基于 Docker 容器构建，以保证在不同计算环境下的结果一致性。

原始 Reads 经过 Fastp 质控后，使用 STAR (v2.7.10) 比对至参考基因组 GRCh38。表达量定量通过 RSEM 执行，并最终转换为 TPM 值。

对于外显子组数据，遵循 GATK Best Practices 流程。使用 BWA-MEM 进行比对，并通过 MuTect2 识别体细胞突变（Somatic Mutations）。

数据库提供以下核心功能模块：