PCA分析

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
主成分分析(Principal Component Analysis,PCA),是对原有的复杂数据进行降维,保持数据集中对方差贡献最大的特征,去除噪音和冗余,从而有效地找出数据中最“主要”的元素和结构,主要影响因素区分各个样本,根据样本远近展示样本/分组间的相似性和差异性。

参数调整

输入文件,根据不同平台可为:探针表达量文件,counts,OTU 等。
数据过滤方式,默认方式为不对数据作处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU。
对结果进行命名用于区分不同的任务,默认为当前工具名称_当前日期时间
样品分组信息文件通常包含两列,第一列为样品名,第二列为各样品相应的分组名,表头须命名为“Group”。
每个组组内至少4个样本时,设置绘制椭圆的置信水平, 默认设置为0.95,在0.5-0.995范围内,值越小椭圆面积越小
设置绘制椭圆的背景透明度,范围可选:0-1
字体类型,默认"Arial"
字体样式,默认"无"
设置PCA2D图点的大小,默认值为4.
设置PCA2D图点的大小,默认值为1.
设置是否展示标签短线,默认当标签距离点一定长度时展示短线。
调整2d图像x轴范围大小缩放比例
调整2d图像y轴范围大小缩放比例
配色方案按照分组进行着色
提交 重置

结果与说明

任务正在排队中,目前后台任务排队数量:

当前任务开始运行后预计需要耗时

请勿重复提交任务!

程序正在运行中,预计需要耗时

{{ m.content }}

程序运行出错,报错信息如下:

玩转攻略可点击公众号推文:PCA分析,一键检验样本组间重复性好坏


1.矩阵文件

    第一列为探针/基因/OTU名称,其余各列为各样品中相应检测值。(下图以基因reads数矩阵为例展示)


counts.png

demo数据下载:PCA_counts.oecloud.xlsx


2.样本分组信息文件(非必选)

    示例文件为样本分组信息,需包含列名 "Group"(注意列名的首字母大写)。


groupPCA.png

demo数据下载:PCA_sample_group.oecloud.xlsx



3.样本分组信息文件(新增二分类标签组,非必须)

    示例文件为样本分组信息,需包含列名 "Group",二分类标签组必须命名为“Group2(注意列名的首字母大写”。




企业微信截图_16717728329323.png

demo数据下载:PCA_sample_group.oecloud1.xlsx


  1. PCA 2D图,使用主成分1(PC1:Principal component 1)和主成分2(PC2:Principal component 2)作为X轴和Y轴绘制散点图,分别提供无标签及添加标签形式。

    PCA_2D1.pngPCA_2D.png




  2. PCA 3D图,使用主成分1、主成分2和主成分3分别作为X轴、Y轴和Z轴绘制散点图。

    PCA_3D.png





  3. PCA 2D图,添加置信椭圆绘图示例如下:

    PCA_2D_2.png




  4. PCA 2D图,添加二分类标签图示例如下:

PCA_2D_1.png


  1. (1) 少于3个样本或者3条数据时,进行主成分分析;

  2. (2) 默认条件下,不对数据做任何处理,各平台数据过滤方式不同,请注意输入文件是否属于以下类型:芯片、转录组测序、微生物多样性OTU;

  3. (3) 绘制置信椭圆,需添加样本分组信息文件,且各组内生物学重复需为4个样本及以上

  4. (4) 导出PCA分析中间结果,即各主成分数据矩阵;

  5. (5) 请使用本工具前,按照输入示例文件格式对数据进行修改;


版本更新日期更新内容
v1.92020.09.27整合多平台主成分分析工具
v1.9.12020.10.25添加置信区间椭圆相关参数
v2.1.22020.11.04修改默认输出图片格式
v2.1.32020.11.13针对目前所遇到的文件格式错误制定报错机制
v2.1.42020.12.11

添加字体参数-PCA-3D除外, 判断编码方式

v2.1.5
2020.12.26
判断编码方式优化, 空数据矩阵检查, 导出pca中间结果
v2.1.5.12020.12.28修复小bug
v2.4.02021.01.22报错日志oeweb_task.log
v2.4.12022.01.30新增控制点大小,标记基因线是否展示参数。选择非png格式时,默认生成png。
v2.4.22022.02.15调整微生物数据绘图比例
v2.4.92022.09.14

添加2d图像x轴和y轴缩放比例参数

v2.4.102022.10.08

优化读取数据模块

v2.5.02022.11.04

添加配色方案

v2.5.12022.12.08

解决3d图分组配色问题

v2.5.22022.12.23

2d图添加二分类标签

v2.5.52023.02.06

添加转录组默认配色

v2.5.72023.02.07

添加微生物默认配色

v2.72023.03.16

更新软件版本

v2.7.62023.06.07

pca某些数据点不显示bug优化


在线咨询