文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
主成分分析(Principal Component Analysis,PCA),是对原有的复杂数据进行降维,保持数据集中对方差贡献最大的特征,去除噪音和冗余,从而有效地找出数据中最“主要”的元素和结构,主要影响因素区分各个样本,根据样本远近展示样本/分组间的相似性和差异性。
任务正在排队中,目前后台任务排队数量:
当前任务开始运行后预计需要耗时
请勿重复提交任务!程序正在运行中,预计需要耗时
程序运行出错,报错信息如下:
玩转攻略可点击公众号推文:PCA分析,一键检验样本组间重复性好坏
1.矩阵文件
第一列为探针/基因/OTU名称,其余各列为各样品中相应检测值。(下图以基因reads数矩阵为例展示)
demo数据下载:PCA_counts.oecloud.xlsx
2.样本分组信息文件(非必选)
示例文件为样本分组信息,需包含列名 "Group"(注意列名的首字母大写)。
demo数据下载:PCA_sample_group.oecloud.xlsx
3.样本分组信息文件(新增二分类标签组,非必须)
示例文件为样本分组信息,需包含列名 "Group",二分类标签组必须命名为“Group2(注意列名的首字母大写)”。
demo数据下载:PCA_sample_group.oecloud1.xlsx
PCA 2D图,使用主成分1(PC1:Principal component 1)和主成分2(PC2:Principal component 2)作为X轴和Y轴绘制散点图,分别提供无标签及添加标签形式。
PCA 3D图,使用主成分1、主成分2和主成分3分别作为X轴、Y轴和Z轴绘制散点图。
PCA 2D图,添加置信椭圆绘图示例如下:
PCA 2D图,添加二分类标签图示例如下:
(1) 少于3个样本或者3条数据时,不进行主成分分析;
(2) 默认条件下,不对数据做任何处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU;
(3) 绘制置信椭圆,需添加样本分组信息文件,且各组内生物学重复需为4个样本及以上;
(4) 导出PCA分析中间结果,即各主成分数据矩阵;
(5) 请使用本工具前,按照输入示例文件格式对数据进行修改;
版本 | 更新日期 | 更新内容 |
---|---|---|
v1.9 | 2020.09.27 | 整合多平台主成分分析工具 |
v1.9.1 | 2020.10.25 | 添加置信区间椭圆相关参数 |
v2.1.2 | 2020.11.04 | 修改默认输出图片格式 |
v2.1.3 | 2020.11.13 | 针对目前所遇到的文件格式错误制定报错机制 |
v2.1.4 | 2020.12.11 | 添加字体参数-PCA-3D除外, 判断编码方式 |
v2.1.5 | 2020.12.26 | 判断编码方式优化, 空数据矩阵检查, 导出pca中间结果 |
v2.1.5.1 | 2020.12.28 | 修复小bug |
v2.4.0 | 2021.01.22 | 报错日志oeweb_task.log |
v2.4.1 | 2022.01.30 | 新增控制点大小,标记基因线是否展示参数。选择非png格式时,默认生成png。 |
v2.4.2 | 2022.02.15 | 调整微生物数据绘图比例 |
v2.4.9 | 2022.09.14 | 添加2d图像x轴和y轴缩放比例参数 |
v2.4.10 | 2022.10.08 | 优化读取数据模块 |
v2.5.0 | 2022.11.04 | 添加配色方案 |
v2.5.1 | 2022.12.08 | 解决3d图分组配色问题 |
v2.5.2 | 2022.12.23 | 2d图添加二分类标签 |
v2.5.5 | 2023.02.06 | 添加转录组默认配色 |
v2.5.7 | 2023.02.07 | 添加微生物默认配色 |
v2.7 | 2023.03.16 | 更新软件版本 |
v2.7.6 | 2023.06.07 | pca某些数据点不显示bug优化 |