主成分分析(PCA)
简介
主成分分析(Principal components analysis,PCA)利用正交变换对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分(Principal Components)。PCA是最简单的以特征量分析多元统计分布的方法。通常情况下,这种运算可以被看作是揭露数据的内部结构,从而更好的解释数据的变量的方法。
数据说明
矩阵形式,第一行为组名,第二行为样品名,其余行为数据。图中坐标轴PC1和PC2为第一、第二主成分(即潜在变量对差异的解释率);点代表样品,不同颜色表示不同分组; 椭圆代表分组按默认68%的置信区间加的核心区域,便于观察组间是否分开;箭头代表原始变量,其方向代表原始变量与主成分的相关性,长度代表原始数据对主成分的贡献度
生物医学常见应用
基因表达的PCA。参考:https://github.com/vqv/ggbiplot
常见问题
1,如何作图?
1,准备作图数据;2,用excel打开数据,调整为示例格式;3,将调整后的数据粘贴到输入框;4,选择参数;5,提交出图
2,为什么不出图?
程序对输入格式有严格要求。请务必仔细查看右侧说明及示例数据。常见错误包括:非制表符分割,数据列数不对,没有带title等
3,导出图片?
默认提供3种类型图片供下载:pdf, svg和png(300 dpi),部分未提供的,请在生成图片上点击鼠标右键,选择另存为(直接是svg格式文件,文件后缀不用改)。推荐使用
chrome浏览器
4,编辑图片,以满足杂志需求?
默认Arial字体,8 x 6(或6 x 6)大小(inch)。下载
Inkscape软件(最兼容,推荐,
inkscape常用技巧),打开另存的svg文件,修改布局,文字等后,导出pdf或其他格式图片
5,如何引用
本站内容未公开发表paper,如需引用,请使用如下格式,或者原生R包:
Heatmap was plotted by http://www.bioinformatics.com.cn, an online platform for data analysis and visualization.