火山图

文献引用:Bioinformatic analysis was performed using the OECloud tools at https://cloud.oebiotech.com.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
火山图(Volcano Plot)是一类用来展示组间差异数据的图像,可以方便直观的展示两组样本间差异表达基因/蛋白/代谢物的分布情况。

参数调整

差异未筛选文件,请参考示例文件。如转录组项目报告中"A-vs-B-all.gene.xls"文件
显著性阈值如 p-value是指在一个概率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的概率,p-value值若与选定显著性水平(0.05或0.01)相比更小,则零假设会被否定而不可接受
注意:输入的数值需为非负数。FC(Fold Change)是计算基因/蛋白/代谢物在两类样本中平均表达水平的倍数值, 若该值达到预先设定的阈值(一般设置为2, 在以2为底的对数表达比中为大于1或小于-1), 则判定基因/蛋白/代谢物为差异表达。
选择配色方案,默认为蓝灰红配色。
代谢组数据过滤条件,默认为0,不进行VIP筛选及可视化,可修改
展示标记名称的top基因数,按照log2FC绝对值从大到小筛选前top数量基因作为标记展示其基因名。
标记名称列表。通过输入框输入的标记基因名称不区分大小写,图片显示的标记基因名以all gene表格为准。注意,若输入的标记名称,则标记基因数参数将会失效。
芯片差异基因文件,需包含列名 "Names",过滤无意义的低质量探针。
标记名称列表(芯片),请参考示例文件。
字体类型,默认"Arial"。
字体样式,默认"无"。
点大小,默认为1.2。取值范围在0-3之间。
点透明度,默认为0.8。取值范围在0-1之间。
x轴坐标最小取值,默认自适应。
x轴坐标最大取值,默认自适应。
轴坐标最大取值,默认自适应。
参考线粗细,默认为0.4。
标记名称字体大小,默认为3。
图片左右上角筛选结果文字展示。默认展示,如需隐藏请在下拉选择中选择隐藏。
图片标题。默认为“Volcano Plot: p-value<0.05 && |log2FC|>1”,可通过输入修改的部分为“Volcano Plot:”。注意:输入的标题字段长度若超过25,将会截取前25个字符。
用于结果的自定义标记
提交 重置

结果与说明

任务正在排队中,目前后台全部排队数量:

当前任务运行预计需要耗时

程序正在运行中,预计需要耗时

{{ m.content }}

程序运行出错,报错信息如下:

1. 差异表达未筛选文件

    示例文件为基因表达量差异未筛选文件,第一列:Names(基因/探针名称),第二列:log2FoldChange,第三列:p-value ;代谢组数据第四列可添加 VIP (注意列名的字母大写

【测序数据整理格式】

测序数据整理格式.png

    demo数据下载sequencing_volcano.xls


【芯片组数据整理格式】

芯片组数据整理格式.png


    demo数据下载array_volcano_all_data.xls(从芯片项目报告中"差异未筛选.csv"文件提取)


【代谢/蛋白组数据整理格式】

代谢蛋白组数据整理格式.png

    demo数据下载metabolite_volcano.xls



2. 文本框输入标记基因(可选)

    需包含列名 "IDs"。

genelist.png


    demo数据下载genelist_one.xls


3. 芯片组差异文件(对芯片数据绘图时必选)和标记基因列表

    示例文件为芯片差异结果列表,需包含列名 "Names"。(从芯片项目报告中"comp*_*_vs._*_FC2P0.05.csv"文件提取)


【芯片组差异文件格式】

deg_prob.png


    demo数据下载:array_volcano_deg_data.xls


    示例文件为芯片标记基因列表,需包含列名 "IDs"。


【芯片组标记基因列表格式】

prob_genelist.png


    demo数据下载:genelist_two.xls



  1. 1. 输出图片

    示例图片中每一个点代表一个基因。横纵坐标分别表示实验组(Case)和对照组(Control)生物学重复差异倍数FC值的对数值。根据基因表达差异倍数FC值的筛选,粉色表示上调基因,红色表示显著上调基因,浅蓝色表示显著基因,深蓝色表示显著下调基因,灰色表示差异不显著。

volcano(1).png


    示例图片为标注名称。

volcano(2).png

  1. (1) 尽量新建全新的excel文件进行数据筛选,不在源文件操作;

  2. (2) 标注特征默认为100个以内;当大于100个特征时不标注;

  3. (3) 当输入文件数据中 log2FoldChange 为空值时,将自动以最小值进行替换,请谨慎修改文件数据;


版本
更新日期更新内容
v1.82020.09.18整合多平台火山图工具
v2.1.22020.11.04修改默认输出图片格式;添加标注特征是否存在相关判断,删除未知特征并输出warning文件
v2.1.42020.12.11

添加字体参数, 判断编码方式, 修改log2FC数据类型报错的bug

v2.1.5
2020.12.26
判断编码方式优化, 空数据矩阵检查, 添加展示基因数目参数默认为30
v2.3.02021.01.22报错日志oeweb_task.log;修改数据检查逻辑
v2.4.02021.02.01增加点大小参数
V1.012021.03.07重构
V1.032021.06.20

调整输入数据表头,修改图形样

V1.052021.11.15添加显著性筛选阈值参数, 修改日期型基因的匹配模式,修改点色系
V1.062022.01.29添加控制x,y轴坐标范围,点透明度,标记基因名称字体大小和位置,参考线粗细等参数。修改控制点大小的逻辑。选择非png格式时,默认生成png。
V1.282022.08.29优化图片配色,添加突出标记基因的配色方案;添加筛选基因数量的标签;适配线下报告输入文件。
V1.332022.09.26优化判断语句,适配不区分大小写的标记基因名。
V1.352022.10.11报错优化,添加自定义标题字段功能。
V1.412022.11.11释放top基因标记参数。
V1.472022.12.05释放筛选后数量的文字展示